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数据 建 模 指 的 是 对 现实 世界 各 类 数据 的 抽象 组 织 ， 确 定数 据 库 需 管 
辖 的 范围 、 数 据 的 组 织 形 式 等 直至 转化 成 现实 的 数据 库 。 而 数据 模型 是 
构建 应 用 系统 的 核心 ， 是 尽 可 能 精准 地 表示 业务 运转 的 概念 性 框 染 。 





本 书 通 过 平实 的 语言 ， 对 数据 模型 及 建 模 过 程 进行 了 深入 浅 出 的 介 
绍 。 全 书 内 容 分 为 5 个 部 分 ， 对 数据 建 模 简介 、 数 据 模型 要 素 ， 松 念 、 
逻辑 和 物理 数据 模型 、 数 据 模型 质量 以 及 数据 建 模 的 进 阶 内 容 等 方面 进 
行 讲解 ， 全 面 细致 地 为 读者 解答 与 数据 建 模 相 关 的 知识 点 和 疑问 。 除 此 
之 外 ， 本 书 的 最 后 还 对 各 类 专业 术语 进行 了 细致 的 解释 ， 方 便 读 者 参 
考 。 














本 书 是 一 本 经 典 的 数据 建 模 指南 ， 非 常 适合 对 数据 建 模 感 兴趣 的 读 
者 以 及 从 事 数据 科学 等 相关 工作 的 专业 人 士 参考 阅读 。 
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建 模 无 疑 都 是 非常 重要 的 。Steve Hoberman 在 本 书 中 ， 清 楚 地 回答 了 什 
么 是 数据 建 模 、 为 什么 会 有 数据 建 模 ， 以 及 怎么 进行 数据 建 模 等 关键 问 
题 ， 并 且 通 过 适当 的 示例 、 类 比 和 练习 进一步 强化 了 涉及 的 各 个 知识 
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Len Silverston 











畅销 图 书 The Data Model Resource Book ( 卷 1、 卷 2 和 卷 3) 的 作者 





数据 建 模 作为 有 待 探索 且 极 具有 潜在 价值 的 领域 ， 其 商业 价值 往往 
隐藏 于 条 个 组 织 的 信息 技术 部 门 。 本 书 既 强调 了 由 此 导致 的 商业 价值 的 
损失 ， 也 提出 了 如 何 体现 其 价值 的 措施 。 在 “为 什么 ”和 “如 何 ” 进 行 数据 
建 模 方 面 ， 给 出 了 一 个 易于 理解 和 详尽 的 指导 ， 同 时 也 提醒 我 们 IT 项 目 
开发 的 成 功 策略 至 少 和 所 使 用 的 信息 技术 同样 重要 。 








— Chris Potts 


企业 IT 策 略 师 及 畅销 图 书 Creating the Ultimate Corporate Strategy for 
Information Technology 的 作者 


对 于 想 了 解数 据 建 模 的 初学 者 来 说 ， 本 书 无 疑 是 一 个 非常 好 的 参考 


指南 。Steve Hoberman 列 出 了 数据 建 模 的 基础 知识 ， 并 且 用 一 种 易于 理 
解 又 非常 有 趣 的 方式 表现 出 来 。 我 相信 每 位 读者 都 能 从 中 汲取 到 目 己 所 





David Marco 





EWSolutions 公 司 总 裁 


非常 好 的 一 本 书 ， 读 起 来 很 有 趣 。Steve 抓 住 了 数据 建 模 的 精华 并 
将 其 简化 ， 对 于 不 从 事 直 接 数据 建 模 工 作 但 又 需要 参与 建 模 的 读者 而 
言 ， 这 是 一 本 非常 好 的 入 门 指南 。 对 于 偶尔 进行 数据 建 模 的 读者 来 说 ， 
这 是 一 本 非常 有 价值 的 参考 书 。 对 于 具有 丰富 经 验 的 建 模 者 来 说 ， 这 本 
书 会 时 刻 提 醒 你 应 该 始终 保持 建 模 过 程 的 简单 化 。 





























David Wells 


商业 智能 顾问 及 讲师 





作为 一 名 数据 架构 师 和 数据 库 设计 者 ， 我 购买 过 很 多 本 相关 的 图 
书 。 对 于 初学 数据 建 模 的 技术 人 员 和 业务 人 员 ， 本 书 是 一 个 非常 好 的 工 
有 其 。Steve 用 自己 的 方式 将 数据 建 模 的 复杂 性 和 基础 知识 进行 讲解 ， 无 
论 读者 具有 怎样 的 经 验 层 次 和 背景 都 能 理解 。 如 采 想 快速 上 手 ， 本 书 将 
古 读者 的 不 二 之 选 。 我 曾 多 次 推荐 本 书 ， 总 能 被 多 数 人 欣然 接受 。 


Tom Bilcze 





Westfield 集团 首席 数据 库 设 计 师 





本 书 是 数据 建 模 初 学 者 以 及 想 拥 有 “话语 权 ” 并 想 理解 建 模 概 念 的 人 
的 必 读 之 作 。 读 者 在 阅读 时 ， 会 有 种 作者 陪伴 左右 的 感觉 ， 作 者 会 回 你 
逐一 介绍 各 个 术语 ， 解 释 各 个 符 写 ， 告 诉 你 动手 之 前 、 建 模 过 程 中 以 及 


建 模 结束 之 后 应 该 考虑 什么 。 


Robert S. Seiner 





总 统 KIK 咨 询 及 教育 服务 有 限 贡 任 公司 总 裁 


tdan.com 数 据 管理 简讯 贡 任 人 








作为 每 天 需要 工作 的 数据 架构 师 ， 有 时 甚至 会 坪 记 为 什么 进行 数据 
建 模 。 我 只 是 知道 了 工作 主题 并 按 目 己 习惯 的 工作 方式 完成 任务 。 我 需 
要 一 个 有 用 的 定义 ， 但 有 时 候 发 现 很 难 和 其 他 人 解释 明白 ， 我 采用 
Steve 的 示例 与 他 们 交流 ， 告 诉 他 们 我 要 做 什么 以 及 为 什么 这 样 做 ， 令 
人 高 兴 的 是 所 有 人 都 能 明白 。 





James Lee 





健康 服务 数据 架构 、 报 表 主 管 





这 是 一 部 近乎 完美 的 图 书 ， 其 内 容 窗 冀 面 广 ， 但 同时 义 将 所 教授 的 
内 容 保持 在 一 个 合理 的 水 平 ， 保 证 其 简洁 性 和 易 用 性 。 本 书 的 可 读 性 很 
强 〈 我 几 次 就 读 完了 ) ， 将 一 个 有 效 且 易于 理解 的 名 片 案例 贯穿 始终 。 








Wayne Little 


Creative 数 据 解决 方案 公司 CEO 





在 我 的 生命 中 有 许多 大 咖 ESRR ， 指 引 我 前 行 。 


这 些 从 事 数 据 管 理 行业 的 大 咖 有 : UML 领 域 专家 Mickael Blaha; $F 
于 语言 表达 的 Wayne Eckerson; 对 于 数据 建 模 定 有 极 大 热情 (而 且 对 我 
的 第 1 版 图 书 给 出 了 中 肯 的 评价 和 建议 ， 并 在 第 2 版 中 做 了 相应 修改 〉 的 
David Hay; 数据 仓库 领域 的 卓越 页 献 者 以 及 对 非 结 构 化 数据 处 理 等 未 
来 趋势 具有 敏锐 观察 力 的 Bill Inmon; 带 来 了 元 数据 主流 处 理 方法 的 
Dave Marco; 推动 数据 治理 领域 的 发 展 ， 并 发 行 了 数据 管理 业界 极 具 价 
值 的 刊物 Tdan.com 的 Bob Seiner; 引发 如 何 建立 数据 模型 的 思考 ， 并 给 
出 了 如 何 提高 团队 合作 的 实践 性 技术 的 Graeme Simsion; 多 才 多 去 且 广 
泛 涉猎 智能 商业 、 数 据 建 模 、 职 业 规 划 、PowerPoint、 援 影 、 啤 酒 等 领 
域 的 David Wells。 





数据 大 咖 们 还 通过 像 DAMA 这 样 的 用 户 组 推动 着 数据 管理 领域 的 发 
展 ， 通 过 志愿 服务 、 个 人 按 月 或 按 季 上 度 组 织 学 术 讨 论 、 安 排 大 会 发 言 、 
撰写 报告 等 活动 推动 行业 进步 ， 并 与 各 类 从 业者 紧密 相连 。 由 于 篇 幅 有 
限 ， 在 此 列举 出 一 些 与 我 共事 多 年 的 数据 大 咖 : Kasi Anderson. Davida 





Berger. Tom Bilcze、Michael Brackett. Jimmy Chen, Susan Earley, 
Ben Ettlinger, Deborah Henderson. Jeff Lawyer. Carol Lehn. Wayne 
Little. Mark Mosley. Bill Nagel. Cathy Nolan. John Schley. Ivan 
Schotsmans#ll Anne Marie Smith. 


还 有 其 他 人 对 这 本 书 的 出 版 给 予 了 积极 支持 。 感 谢 Bill Graeme fil 
Michael 对 本 书 内 容 的 补充 ， 感 谢 Jeani 对 第 1 版 的 修订 ， 感 谢 Carol 出 色 的 
编辑 工作 ， 感 谢 Matk 非 常 精 彩 的 封面 设计 ， 感 谢 Abby 完 美的 卡通 设 
计 。 








当然 还 应 该 感谢 那些 数据 世界 以 外 的 人 们 。 感 谢 父 杀 的 正直 诚实 、 
只 业 道 德 以 及 解决 问题 的 能 力 。 感 谢 母 杀 为 我 树立 了 一 个 热爱 分 享 知 识 
的 榜样 。 感 谢 Jenn 一 直 让 我 的 生活 很 甜 密 。 感 谢 Sadie 和 Jamie 一 直 陪 伴 
着 我 ， 并 且 提 醒 我 让 每 天 的 生活 简单 化 。 
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数据 模型 是 构建 应 用 系统 的 核心 ， 是 尽 可 能 精准 地 表示 业务 运转 的 
概念 性 框架 。 数 据 模 型 定义 了 操作 者 、 行 为 以 及 管理 业务 处 理 流程 的 规 
则 ， 并 将 定义 内 容 用 人 们 和 应 用 程序 都 能 理解 的 标准 语法 进行 描述 。 本 
质 上 ， 数 据 模 型 将 业务 中 涉及 的 概念 转换 为 计算 机 代码 ， 以 致 于 应 用 程 
序 和 计算 机 系统 都 能 按 设 计 者 的 意图 处 理 各 类 信息 。 如 果 没 有 数据 模 
型 ， 任 何 组 织 机 构 都 不 可 能 实现 信息 的 自动 化 处 理 。 





鉴于 数据 模型 在 应 用 系统 开发 过 程 中 扮演 着 关键 角色 ， 尝 无 疑问 ， 
数据 模型 将 决定 应 用 系统 开发 及 使 用 效率 。 即 便 程序 设计 方面 已 经 做 到 
了 完美 ， 但 不 民 的 数据 模型 设计 同样 会 带 来 灾难 性 的 破坏 。 执 行 性 能 
降 ， 不 精确 的 查询 结果 ， 没 有 弹性 的 规则 和 不 一 致 的 元 数据 等 都 是 不 恨 
数据 模型 引发 的 后 条 。 





另 一 方面 ， 设 计 精 恨 的 数据 模型 是 企业 用 户 与 信息 技术 专家 之 间 的 
桥梁 。 在 应 用 系统 项 目 开发 之 初 ， 借 助 数 据 模型 企业 与 信息 技术 专家 间 
就 业务 运转 达成 共识 。 信 息 技 术 专 家 将 业务 运转 用 概念 数据 模型 及 馆 辑 
数据 模型 进行 描述 。 企 业 用 户 则 可 以 对 模型 进行 审阅 ， 在 编写 程序 代码 
之 前 对 模型 进行 必要 的 更 正和 改进 。 





很 难 想象 有 谁 能 像 本 书 作者 Steve Hoberman 那 样 ， 用 如 此 简单 朴素 
的 语言 解释 数据 模型 ， 很 多 数据 模型 工程 师 因 此 沉醉 于 他 们 的 工作 实践 
中 。 如 果 没 有 Steve， 谁 可 能 将 Steve 为 The Data Warehousing Institute 讲 
授 的 课程 教 得 如 此 生动 有 趣 ， 清 晰 明了 ? 像 在 Steve 有 所 车 的 男 一 本 车 作 











(The Data Modeler’s Workbench ) 中 看 到 的 一 样 ，Steve 不 仅 知 识 渊 

博 ， 而 且 还 非常 善于 与 各 种 读者 沟通 。Steve 对 于 数据 建 模 技 术 拥 有 无 
与 伦比 的 热情 和 能 量 。 同 时 ，Steve 还 是 我 们 研究 中 心里 一 位 最 受 他 人 
爱戴 的 成 员 之 一 。 








符合 庞大 的 需求 。 非 常 高 兴 Steve 决 定 撰 写 这 本 著作 ， 因 为 这 类 图 
书 拥有 巨大 的 市 场 需求 。 即 使 数据 模型 对 于 应 用 系统 的 开发 至 关 重 要 ， 
但 仍 有 一 大 批 业务 人 员 和 部 分 技术 人 员 缺 乏 对 数据 模型 的 理解 。 这 本 著 
作 的 问世 ， 无 疑 将 唤起 众多 业务 及 技术 人 员 对 数据 模型 重要 性 的 认识 。 





特别 地 ， 那 些 应 用 系统 开发 的 倡议 人 ， 或 被 安排 进项 目 组 的 业务 人 
员 ， 将 发 现 这 本 著作 是 非常 适宜 的 入 门 读物 。 对 于 刚刚 入 行进 行 应 用 系 
统 设计 的 专业 技术 人 员 ， 这 本 著作 同样 是 快捷 、 简 单 学 习 数 据 建 模 基础 
的 优秀 读物 。 大 学 教授 为 了 帮助 学 生 们 和 掌握 数据 建 模 的 有 关 概 念 、 术 
语 、 成 功 准 则 等 ， 这 本 著作 也 很 值得 推荐 给 他 们 。 











一 Wayne W. Eckerson 


数据 仓库 研究 服务 中 心 主任 





『 言 直接 进入 正文 。 但 还 是 
前 言 将 帮助 读者 对 每 一 单 
部 分 的 学 习 目 标 。 


强烈 推荐 读者 能 先 从 前 言 部 分 开局 本 书 之 


相信 很 多 读者 和 我 一 样 ， 通 常 部会 略 过 前 
旅 。 
元 、 每 一 章节 有 一 个 大 体 认 识 ， 并 事先 了 解 各 





本 书 的 10 个 目标 

1. 将 会 理解 在 什么 情况 下 需要 数据 模型 ， 以 及 各 种 情形 下 最 适当 
的 数据 模型 类 型 是 什么 

2. 能 像 阅读 一 本 小 说 那样 ， 轻 松 自如 地 读 懂 任何 规模 和 复杂 度 的 
模型 。 

3. 具备 创建 完整 的 规范 化 关系 数据 模型 和 维度 模型 的 能 








4. 有 具备 将 一 个 逻辑 模 型 转换 为 高 效 物理 模型 的 能 








5. 具备 使 用 模板 工具 ， 高 效 获取 应 用 需求 的 能 


6. 具备 解释 数据 模型 记分 卡 中 10 个 计 分 项 的 能 


7. 掌握 如 何 与 其 他 人 员 建 立民 好 工作 关系 的 实践 经 验 。 
8. 了解 非 结构 化 数据 及 其 模型 化 。 
9. 了 解 UML 的 基本 概念 。 


10. 具备 XML 环 境 中 创建 数据 模型 的 能 力 ， 并 了 解 元 数据 和 敏捷 
开关 的 基本 概念 。 





本 书包 含有 5 个 部 分 ， 第 1 部 分 引入 数据 建 模 ， 并 介绍 了 数据 建 模 的 
目的 和 变化 。 第 2 部 分 说 明 数 据 模 型 中 的 所 有 组 件 。 第 3 部 分 介绍 天 系 型 
和 维度 型 概念 模型 、 逻 辑 模 型 和 物理 模型 。 第 4 部 分 则 关注 如 何 使 用 模 
板 提 高 数据 模型 质量 ， 介 绍 数据 模型 记分 卡 以 及 如 何 与 业务 人 员 、 项 目 
团队 高 效 沟 通 。 第 5 部 分 讨论 关于 数据 建 模 的 常见 疑问 。 








将 本 书 内 容 与 10 个 学 习 目 标 关 联 起 来 看 ， 第 1 部 分 的 前 半 节 完成 了 
目标 1， 第 2 部 分 完成 了 目标 2， 第 3 部 分 完成 了 目标 3 和 4， 第 4 部 分 完成 
了 目标 5、6 和 7， 第 5 部 分 则 完成 目标 8、9 和 10。 


第 1 部 分 由 3 半 组 成 。 第 1 革 引 入 数据 模型 ， 并 通过 两 个 实例 〈 冰 淇 
淋 和 和 名片 ) 说 明 数 据 模 型 的 作用 ， 这 两 个 实例 贯穿 始 终 ， 便 于 读者 对 需 
求 分 析 到 模型 设计 的 整个 建 模 过 程 有 所 认识 。 第 2 章 介绍 了 数据 模型 的 
两 个 非常 有 价值 的 特征 : 交流 性 和 精确 性 。 同 时 本 章 还 就 数据 模型 最 行 
之 有 效 的 领域 给 予 讨 论 。 第 3 章 将 数据 模型 与 照相 机 做 以 类 比 ， 说 明天 
于 照相 机 的 4 种 设置 同样 适用 于 数据 模型 。 理 解 4 种 设置 对 数据 模型 的 影 
响 将 极 大 增加 建 模 成 功 的 可 能 性 。( 注 : 应 用 系统 是 为 特定 用 户 设计 的 
以 实现 一 定 功 能 的 一 个 程序 或 程序 集 ， 如 文字 处 理 系统 、 订 单 处 理 系 





统 、 利 润 报表 系统 等 。) 





体 ， 第 5 章 介 绍 属性 ， 第 6 章 介 绍 关 系 ， 第 7 章 介 绍 键 。 





第 3 部 分 由 随后 的 3 章 构成 ， 其 中 讨论 了 概念 模型 、 逻 辑 模型 和 物理 
模型 这 3 种 不 同类 型 的 模型 。 第 8 章 着 重 学 习 概 念 模型 并 讨论 了 在 创建 概 
念 模型 过 程 中 的 3 种 变化 。 第 9 章 学 习 关 系 及 维度 逻辑 模型 。 第 10 章 介绍 
物理 模型 ， 重 点 学 习 使 用 反 规 范 化 和 分 区 等 不 同 技术 实现 物理 模型 的 高 
效 设计 ， 同 时 还 将 学 习 渐 变 维度 模型 。 








第 4 部 分 包 舍 3 章 内 容 。 讲 解 如 何 使 用 模板 、 数 据 模 型 记分 卡 及 如 何 
有 效 地 与 业务 人 员 、 项 目 组 成 员 进 行 交 流 沟通 ， 从 而 提高 数据 模型 质 
量 。 第 11 章 推荐 了 多 种 用 于 获取 、 验 证 用 户 需 求 的 模板 ， 模 板 的 使 用 将 
有 助 于 降低 时 间 开 销 并 提高 建 模 精度 。 第 12 章 讲解 数据 模型 记分 卡 以 验 
证 数据 模型 质量 。 第 13 章 介绍 了 如 何 与 其 他 团队 成 员 协 作 以 及 高 效 共 事 
的 一 些 实践 经 验 。 

















第 5 部 分 也 包含 3 章 内 容 ， 其 中 介绍 了 凌 轨 于 数据 建 模 之 上 的 有 关 主 
题 。 第 14 章 介绍 非 结 构 化 数据 ， 因 为 非 结构 化 数据 的 处 理 是 当前 流行 的 
趋势 。 本 章 介 绍 了 分 类 、 本 体 两 个 处 理 技术 。 第 15 章 学 习 统 一 建 模 语 言 
UML 中 涉及 数据 模型 的 内 容 。 第 16 章 给 出 了 经 常 被 提 及 的 5 个 疑问 ， 并 
一 一 解答 ， 其 中 包括 XML、 元 数据 、 敏 捷 开发 。 








第 2 版 在 第 1 版 的 基础 上 做 了 很 大 的 改进 。 所 有 半 市 相 比 第 1 版 部 变 
化 很 多 ， 其 中 更 多 地 引入 了 新 技术 和 示例 。 而 且 第 2 版 更 注重 数据 模型 
创建 过 程 。 作 为 强化 概念 ， 关 键 点 都 被 添加 至 每 章 的 结尾 。 每 章 开篇 之 


处 也 添加 了 3 行 新 体 许 ， 给 出 了 各 昔 梗 概 。 


本 书 还 引入 一 则 新 术语 : 路 径 搜寻 (Wayfinding) ， 并 重点 介绍 了 
如 “元 数据 ”等 多 个 建 模 领域 中 容易 被 混淆 的 概念 。 本 书 还 添加 一 些 很 有 
针对 性 的 习题 ， 并 给 出 了 参考 答案 。 本 书 最 后 还 罗列 出 本 书 涉及 的 全 部 
名 词 解释 。 





本 书 的 另 一 大 特色 在 于 其 并 非 由 一 名 作者 独立 完成 。 在 写作 之 初 ， 
我 曾 尝 试 撰写 有 关 UML 和 非 结构 化 数据 有 关 的 内 容 ， 但 我 很 快意 识 到 
其 他 专家 学 者 的 作品 更 好 。 于 是 请 Graeme Simsion, Bill Inmon 和 
Michael Blaha 这 3 位 专家 分 别 撰写 了 本 书 的 第 13 章 、 第 14 瘟 和 第 15 草 。 




















数据 建 模 不 只 是 一 种 工作 或 职业 ， 它 还 是 一 种 思想 ， 一 种 无 价 的 过 
程 和 生活 方式 。 但 请 尽量 保持 其 简单 实用 ， 现 在 一 起 开始 建 模 之 旅 吧 。 


第 1 部 分 ”数据 建 模 人 简介 





第 1 部 分 将 引入 数据 建 模 ， 并 介绍 了 数据 模型 的 目的 及 其 类 型 。 完 
成 该 部 分 学 习 之 后 ， 读 者 将 可 以 对 在 什么 情况 下 需要 引入 数据 模型 进行 
判断 ， 并 可 以 根据 实际 情况 选择 适当 的 数据 模型 类 型 。 读 者 还 应 该 可 以 
通过 数据 模型 特征 进行 模型 评 佑 ， 并 能 针对 特定 的 模型 确定 其 特征 的 优 
劣 及 确定 该 模型 与 其 创建 目的 是 否 吻合 。 





第 1 章 将 引入 数据 模型 ， 并 通过 两 个 实例 对 这 一 强 有 力 工具 进行 阐 


述 。 这 两 个 实例 也 将 贯穿 整 本 教程 。 因 为 我 个 人 偏好 甜品 ， 所 以 一 个 实 
例 与 冰淇淋 有 关 〈 是 的 ， 冰 淇 淋 ) 。 另 外 一 个 实例 是 对 名 片 进行 数据 建 
模 。 无 论 是 冰淇淋 ， 还 是 名 片 ， 都 用 来 说 明 建 梗 技术 ， 这 样 该 者 可 以 从 
需求 分 析 到 模型 设计 了 解 整个 建 模 过 程 。 


第 2 半 介 绍 了 数据 模型 的 两 个 非常 有 价值 的 特征 ， 交流 性 和 精确 
性 。 读 者 将 了 解 到 模型 交流 性 如 何 体现 以 及 3 种 可 能 弱化 模型 精确 性 的 
情形 。 本 章 还 从 业务 及 应 用 程序 两 个 领域 对 数据 模型 的 应 用 进行 了 说 
明 。 





第 3 章 将 数据 模型 与 照相 机 进行 比 对 ， 说 明 用 于 照相 机 的 4 种 设置 可 
以 完美 适用 于 数据 模型 。 对 数据 模型 设置 的 理解 将 极 大 增加 应 用 程序 开 
发 成 功 的 可 能 性 。 本 章 还 比 对 了 图 像 格式 与 数据 模型 ， 由 此 引入 数据 模 
型 的 3 个 层次 : has. Wea. EE 


第 1 革 ”数据 模型 





我 怎样 才能 到 达 目 的 地 ? 
地 图 、 设 计 复 图 、 数 据 模 型 
请 为 我 指引 迷津 。 


当 我 又 一 次 意识 到 自己 完全 迷路 的 时 候 ， 我 司 恼 地 重重 拍 了 一 下 方 
问 盘 。 要 知道 ， 我 正 独自 行驶 在 法 国 的 公路 上 ， 赶 着 去 参加 一 个 非常 重 
要 的 商务 会 议 ， 而 且 此 时 距离 天 亮 还 有 一 个 小 时 ， 还 好 我 发 现 前 方 有 一 
家 正 准 备 开张 的 加 油 站 ， 我 停 下 来 ， 走 了 进去 ， 并 把 目的 地 的 地 址 拿 出 
来 给 服务 员 看 。 





我 不 会 六 法语， 那个 服务 员 也 不 会 讲 英 语 ， 我 需要 帮助 ， 但 无 法 通 
过 言语 交流 ， 和 幸亏 他 认 出 了 我 要 访问 的 公司 的 名 字 ， 最 后 他 拿 出 了 纸 
笔 ， 给 我 画 了 一 张 示意 图 。 如 图 1.1 所 示 ， 他 用 线条 表示 街道 ， 用 圆圈 
表示 环岛 路 口 并 配 有 相应 的 数字 表示 出 口 ， 还 用 矩形 框 表 示 加 油 站 
(Petrol〉 和 我 的 目的 地 (MFoods) 。 














这 个 由 服务 员 绘 制 的 地 图 里 ， 只 包含 与 我 的 行程 相关 的 信息 ， 在 它 
的 帮助 下 ， 我 顺利 抵达 目的 地 。 事 实 上 ， 这 张 地 图 束 是 一 个 我 旅行 所 二 
要 的 实际 道路 的 模型 。 


地 图 是 对 复杂 地 理 景观 (geographic landscape) 的 简化 ， 同 理 ， 数 
据 模 型 也 是 对 复杂 信息 景观 (information landscape) 的 简化 ， 本 章 将 以 
冰淇淋 和 名 片 为 例 ， 介 绍 被 誉 为 路 径 搜寻 工具 〈wayfinding tool) 的 数 
据 模型 及 其 重要 作用 。 


























图 1.1 简单 的 地 理 景观 示意 图 











1.1 路 径 搜寻 说 明 


如 果 “ 数 据 模型 ”不 能 引起 你 或 你 的 业务 伙伴 们 的 兴趣 ， 你 可 以 使 
用 “路 径 搜 寻 〈wayfinding) "PUAN, KERTENA WARR 
物 使 用 的 撤 术 及 工具 ， 以 实现 从 一 个 地 点 抵达 到 另外 一 个 。 如 果 一 位 旅 
行者 用 天 空中 的 星斗 导航 ， 那 么 星斗 便 是 他 的 路 径 搜寻 工具 ， 同 理 ， 地 
图 、 指 南 针 也 都 是 此 类 工具 。 














所 有 的 模型 也 是 路 径 搜 寻 工 具 。 模 型 是 一 组 文字 及 各 类 符号 的 集 
合 ， 用 来 将 一 个 复杂 的 概念 简单 化 。 我 们 生活 在 一 个 令 人 眼花 综 乱 的 世 
界 ， 人 们 很 难 将 注意 力 集中 在 一 些 关 键 信 息 上 ， 从 而 无 法 做 出 一 个 明智 
的 决策 。 而 地 图 可 以 帮助 旅行 者 游 宽 一 座 城市 ， 组 织 结构 图 可 以 帮助 员 
工 理 解 组 织 间 的 相互 关系， 设计 北 图 则 可 以 帮助 建筑 师 交 流 建 造 计划 。 
所 以 ， 地 图 、 组 织 结构 图 、 设 计 政 图 部 是 对 复杂 事物 的 过 滤 和 简化 ， 以 
帮助 人 们 理解 现实 世界 ， 提 高 路 径 搜寻 能 











在 法 国 的 这 次 旅行 ， 要 不 是 加 油 站 服务 员 绘制 了 地 图 ， 证 我 立刻 明 
日 如 何 抵达 目的 地 ， 我 可 能 得 多 人 花 几 个 小 时 ， 并 且 不 断 辜 壁 。 模 型 则 使 
用 一 些 标准 符号 让 人 们 快速 地 理解 相应 的 内 容 。 例 如 ， 在 服务 员 绘 制 的 
地 图 里 ， 他 用 线条 表示 街道 ， 用 圆 峰 表示 坏 咏 路 口 ， 正 是 这 些 符 写 帮助 
我 在 脑海 中 映射 出 一 条 条 街道 和 一 个 个 路 口 。 








1.2 ”数据 模型 说 明 








当 我 还 在 读 大 学 的 时 候 ， 课 堂上 教授 们 经 常会 在 挂图 板 上 写 下 大 量 
内 容 ， 而 学 生 们 则 疲 于 整 理 笔记 。 在 这 种 情况 下 ，“ 信 息 过 
载 ”(information overload) 可 以 用 来 形容 这 种 状况 ， 即 当前 的 信息 量 超 
出 了 大 脑 所 能 接受 的 最 大 信息 量 。 此 时 最 好 在 校园 里 朵 逛 一 会 ， 亦 或 打 
打 网 球 ， 亦 或 玩 半 小 时 的 太空 入 侵 者 游戏 (Space Invaders) ， 让 里 心得 
以 放松 ， 以 便 接 受 更 多 信息 。 然 而 现代 社会 ， 人 们 创造 并 接受 越 来 越 多 
的 信息 ， 但 体 轧 、 放 松 的 时 间 却 越 来 越 少 。 而 且 我 经 和 营 听 到 这 样 的 说 法 
一 在 世界 范围 内 ， 信 息 量 以 每 年 60% 的 速度 递增 ， 这 让 我 不 禁 感叹 ， 在 
如 此 众多 的 信息 面前 ， 我 们 真正 和 掌握、 理解 的 信息 是 多 么 有 限 。 

















羊 运 的 是 ， 数 据 模型 这 一 工具 可 以 帮助 我 们 有 效 地 简化 所 有 信息 。 
类 似 于 路 径 搜 寻 工 具 ， 无 论 是 商务 专员 ， 还 是 IT 专 家 ， 都 可 以 有 效 地 使 
用 数据 模型 ， 即 利用 一 组 符号 、 文 本 来 准确 表达 真实 信息 的 精简 子 集 ， 
以 便 改善 某 一 组 织 内 部 的 交流 、 沟 通 ， 并 提供 一 个 更 灵活 、 更 健壮 的 应 
用 环境 。 例 如 ， 在 法 国 地 图 上 用 线条 表示 公路 。 又 如 ， 在 数据 模型 里 可 
以 把 “客户 ”这 两 个 字 用 矩形 框 起 来 ， 表 示 一 些 实际 、 具 体 的 客户 ， 如 
Bob. IBM, Walmart. 














换言之 ， 地 图 是 对 复杂 地 理 景观 的 简化 ， 而 数据 模型 则 是 对 复杂 信 
恩 景 观 的 简化 。 很 多 情形 下 ， 现 实数 据 的 极其 复杂 性 使 得 数据 模型 看 起 
来 异常 简单 ， 例 如 服务 员 给 我 绘制 的 那些 环 咏 路 口 。 





数据 模型 是 一 组 由 符号 、 文 本 组 成 的 集合 ， 用 以 准确 表达 信息 景 


WM, KBAR. VHA. fH a OM TT ee Hae, ASS 
主要 使 用 矩形 框 、 线 段 等 元 素 摘 述 数据 模型 ， 当 然 还 可 以 使 用 统一 建 模 
语言 (UML) 类 图 (Class Diagrams) 、 电 子 表格 (spreadsheets) ~ JÑ 
态 转 换 图 (State Transition Diagrams) 。 所 有 这 些 模 型 都 可 以 视 为 在 复 
革 信 息 世 界 里 的 路 径 搜 寻 工 具 ， 都 可 以 显示 对 复杂 信息 世界 的 简化 。 








1.3 ”有趣 的 冰淇淋 


电子 表格 可 能 是 我 们 在 日 常 工作 生活 中 最 熟悉 的 一 种 数据 模型 。 电 
子 表格 是 纸 质 工作 表格 的 一 种 表示 形式 ， 表 单 中 包含 由 行 和 列 构成 的 网 
格 ， 网 格 中 的 每 个 单元 格 都 可 以 存放 文本 或 数字 ， 表 单 中 的 列 通 党 表示 
不 同类 型 的 信息 。 假 设 我 刚刚 结束 一 段 旅程 返回 罗马， 我 喜欢 那里 的 订 
EG Cgelato) ， 当 我 们 一 起 走 进 一 个 冰淇淋 店 时 ， 你 应 该 会 注意 到 几 
个 表单 ， 表 1.1 为 一 个 冰淇淋 口味 列表 ， 表 1.2 则 包含 了 冰淇淋 大 小 及 价 
格 信 息 。 














表 1.1 冰淇淋 口味 














表 1.2 冰淇淋 大 小 及 价格 


1 匙 1.75 


2 匙 2.25 


3 是 2.60 








上 述 表 单 也 是 一 个 数据 模型 ， 因 为 它 用 一 组 符号 集合 〈 本 例 中 用 的 
征文 本 ) 来 描述 现实 世界 的 一 些 事 物 (本 例 中 描述 了 美味 的 冰淇淋 口味 
及 其 价格 ) 。 你 们 猜 猜 我 买 了 几 是 巧克力 口味 的 冰淇淋 ? 


数据 模式 形式 (data model format) 是 本 书 的 主题 之 一 ， 而 且 与 上 
例 中 的 表 蛙 非常 类 似 。 虽 然 数 据 模型 是 一 个 较 宽泛 的 概念 ， 但 这 里 需要 
注意 的 是 当 使 用 数据 模型 这 一 术语 时 ， 其 形式 需 引 起 我 们 足够 的 重视 。 
但 不 同 于 数据 表单 ， 数 据 模型 应 满足 如 下 要 求 。 











。 只 包含 类 型 : 数据 模型 中 通 闻 无 需 显 示 ， 如 巧 苑 力 或 3 三， 这 样 共 
体 的 数据 ， 需 要 显示 的 是 数据 对 应 的 概念 或 类 型 。 比 如 ， 上 述 数 据 
模型 中 显示 的 类 型 为 冰淇淋 口味 ， 而 非 巧克力 或 香草 这 样 具体 的 











值 ， 还 显示 了 冰淇淋 大 小 ， 而 不 是 具体 的 值 ，1 古 或 2 古 。 
。 包含 相互 作用 : 数据 模型 还 需要 抓 住 不 同 概念 、 类 型 间 的 相互 作 
用 。 比 如 ， 冰 淇 淋 口 味 与 大 小 之 间 的 相互 作用 是 什么 ? 如果 有 人 要 
买 3 古 冰淇淋 ， 那 么 这 3 古 是 同一 种 口味 ， 还 是 3 种 不 同 的 口味 。 正 
如 冰淇淋 口味 与 大 小 间 的 相互 作用 ， 在 一 个 数据 模型 中 要 求 表述 不 
同类 型 间 的 相互 作用 。 

提供 一 个 简洁 的 交流 媒介 : 比 起 仅 使 用 数据 表单 进行 交流 ， 用 包 
含 数据 模型 的 文档 交流 ， 其 效率 要 高 得 多 。 数 据 模 型 显示 各 个 关 
型 ， 并 用 简单 且 有 效 的 符号 表达 它们 之 间 的 相互 作用 。 对 于 冰淇淋 
这 个 实例 ， 为 了 有 效 描述 各 个 类 型 以 及 它们 之 间 的 相互 作用 ， 显 然 
数据 模型 是 种 更 为 精练 的 工具 ， 而 仅 使 用 数据 表单 往往 达 不 到 这 样 
的 效果 。 








1.4 ARRAY 


4 Fr (Business Card) 包含 了 丰富 的 关于 某 人 及 其 单位 的 信息 。 本 
书 中 ， 我 会 用 名 片 作 为 基本 模型 ， 来 阐述 许多 与 数据 模型 相关 的 概念 ， 
通过 构建 一 个 名 片 数 据 模 型 ， 我 们 可 以 杀 号 感受 到 从 具体 的 名 片上 能 获 
得 多 少 信息 ， 或 者 从 更 广泛 意义 上 的 联系 人 管理 领域 能 获得 多 少 信 息 。 








我 打开 床头柜 抽 导 (惊人 的 是 自从 20 世 纪 90 年 代 中 期 抽 居 就 未 被 整 
理 过 ) ， 抓 起 一 把 名 片 ， 铺 在 桌 上 ， 挑 出 最 有 趣 的 4 张 建 模 。 第 1 张 是 我 
本 人 现在 的 名 片 。 第 2 张 是 多 年 以 前 麦子 和 我 创办 的 互联 网 公司 的 名 
片 。 还 有 一 张 是 一 位 魔术 师 的 名 片 ， 他 曾经 在 我 们 的 聚会 上 表演 过 。 最 
后 一 张 是 我 最 钟爱 的 一 家 饭店 的 名 片 。 为 了 保护 个 人 隐私 ， 我 修改 了 姓 
名 和 联系 方式 ， 如 图 1.2 所 示 。 











WALK AROUND MAGIC CHILDREN’S PARTIES 
Steve Hoberman 
President 


me @stevehoberman.com 
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BillSmith@TheAmazingRolando.com 


10 Main St | New York, NY 10021 | 212-555-1212 


Steve Hoberman 
& Associates, LLC 
732-555-1212 BILL SMITH 


findsonline.com 


Internet Auction Experts 


Steve@findsonline.com 
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Banquet 554-1212 
Reservations@RaritanRiverClub.com 


Steve and Jenn 
58 Church Avenue 
(973) 555-1212 New Brunswick, NJ 08901 
(908) 333-1212 





图 1.2 ”床头柜 里 的 4 张 名 片 








在 这 些 名 片上 你 能 看 到 什么 信息 ? 





假设 我 们 这 次 练习 的 目的 是 理解 名 片上 的 信息 ， 并 以 实现 一 个 成 功 
的 联系 人 管理 应 用 程序 为 最 终 的 目标 。 让 我 们 先 列 出 以 下 一 些 信 息 。 


Steve Hoberman & Associates, LLC 
BILL SMITH 
Jon Smith 


212-555-1212 


MAGIC FOR ALL OCCASIONS 
Steve and Jenn 

58 Church Avenue 

FINE FRESH SEAFOOD 
President 


我 们 很 快 就 能 意识 到 ， 尺 管 这 里 只 处 理 4 张 名 片 ， 但 是 即便 列 出 所 
有 的 信息 ， 对 于 帮助 理解 数据 模型 也 是 非常 有 限 的 。 进 一 步 地 ， 设 想 一 
下 如 果 我 们 要 处 理 的 名 片 不 仅仅 局 限于 4 张 ， 而 是 扩大 到 床头柜 里 的 所 
有 名 片 ， 或 者 更 糟 ， 扩 大 到 曾经 收 到 的 每 一 张 名 片 ! 很 快 ， 数 据 量 就 超 
Stil I o 





数据 模型 将 数据 汇总 ， 从 而 让 它们 更 容易 理解 。 例 如 ， 我 们 查看 下 
列 数据 ， 发 现 这 组 数据 适合 放 在 一 个 被 售 名 为 “公司 名 称 ”(Company 
Name) 的 数据 组 中 (电子 表格 中 的 列 标 题 〉。 


Steve Hoberman & Associates, LLC 
The Amazing Rolando 
findsonline.com 

Raritan River Club 


男 外 一 个 电子 表格 中 的 列 标题 应 该 为 “电话 写 码 ”(Phone 


Number) 。 表 1.3 为 一 个 列 出 部 分 名 片 信息 的 表单 。 





表 1.3 名 片 信 息 


| 
Steve Hoberman & Associates, LLC |212-555-1212 























人 
The Amazing Rolando 732-555-1212 
Raritan River Club (908) 333-1212 (908) 555-1212 554-1212 








再 进一步 做 这 个 练习 ， 我 们 可 以 将 名 片 中 的 不 同 数据 组 织 到 以 下 各 
个 组 中 。 


姓名 Person name 

职务 Person title 
公司 名 称 Company name 
电子 邮箱 Email address 

网 页 Web address 


通信 地 址 Mailing address 


电话 号 码 Phone number 
标志 Logo (the image on the card) 


专业 Specialties (such as “MAGIC FOR ALL 
OCCASIONS”) 


人 至此， 结束 了 吗 ? 这 组 列表 就 是 一 个 数据 模型 ? 答案 是 否定 的 。 我 
们 丢失 了 一 个 关键 要 素 : 数据 组 之 间 的 相互 作用 或 关系 。 例 如 ， 公 司 名 
称 和 电话 号 码 之 间 有 什么 关系 ? 一 个 公司 可 以 有 多 个 电话 号 码 吗 ? 一 个 
电话 号 码 可 以 属于 多 个 公司 吗 ? 没有 电话 号 码 ， 一 个 公司 可 以 存在 吗 ? 
在 建立 数据 模型 的 过 程 中 ， 这 一 类 问题 都 需要 被 提 出 并 解答 。 











为 了 建立 任何 一 种 路 径 搜寻 工具 ， 人 们 通常 在 迷路 足够 多 次 之 后 ， 
才 有 可 能 发 现 正 确 的 路 径 ， 例 如 第 一 个 为 东 地 区 绘制 地 图 的 人 ， 一 定 会 
人 花费 很 多 时 间 ， 走 过 很 多 灾 路 ， 才 能 完成 其 工作 。 可 见 绘制 地 图 是 一 个 
具有 挑战 性 并 需要 一 定时 间 花 销 的 过 程 。 


创建 并 完成 一 个 数据 模型 往往 会 遇 到 相同 的 情形 ， 与 概念 “数据 模 
型 ?相应 地 还 有 一 个 概念 “数据 建 模 ”。 数 据 建 模 是 建立 数据 模型 的 过 
程 ， 更 具体 地 说 ， 数 据 建 模 为 了 明确 东 一 组 织 结构 及 其 操作 ， 而 使 用 一 
组 技术 和 实施 一 些 活 动 ， 即 提出 一 个 信息 解决 方案 ， 从 而 实现 该 组 织 的 
东 些 目标 。 当 然 在 数据 建 模 过 程 中 ， 还 需要 很 多 技能 ， 如 专心 聆听 ， 尽 
可 能 提出 大 量 问 题 ， 甚 至 耐心 。 














数据 建 模 者 要 求 能 与 来 目 不 同 部 门 ， 具 有 不 同 技术 背景 ， 不 同业 务 
经 验 ， 不 同 技能 水 平 的 人 员 交 流 、 沟 通 。 在 交流 中 ， 数 据 建 模 者 不 仅 需 





要 理解 每 个 人 员 的 观点 ， 而 且 还 需要 通过 反馈 证 明理 解 无 误 ， 最 终 作 为 
组 件 ， 构 建 在 模型 中 。 在 一 个 项 目的 初期 ， 通 常数 据 建 模 者 没 必 要 去 处 
理 所 有 数据 模型 所 需 的 数据 ， 但 阅读 大 量 相 天文 档 、 咨 询 数 百 个 与 业务 
有 关 的 问题 则 是 必要 的 。 








1.5 练习 1: 教 教 你 的 邻居 


为 了 强化 数据 模型 认识 ， 读 者 可 以 试图 向 非 T 人 士 ， 如 邻 大 、 家 人 
或 朋友 ， 解 释 这 一 概念 。 


AeA Tes SS? 


NS 


在 本 书 的 后 面 有 关于 如 何 解释 数据 模型 这 一 概念 的 参考 答案 。 








V 路 径 搜寻 奢 括 所 有 被 人 类 或 动物 使 用 的 技术 及 工具 ， 以 实现 从 一 个 地 
点 抵达 到 另外 一 个 地 点 。 














V 数据 模型 是 一 组 由 符号 、 文 本 组 成 的 集合 ， 用 以 准确 表达 信息 景观 ， 
达到 有 效 交 流 、 沟 通 的 目的 。 























V 数据 模型 具有 多 种 表现 形式 ， 而 最 常见 并 得 到 广泛 理解 的 形式 为 电子 
表格 。 























V 数据 模型 形式 是 本 书 的 主题 之 一 ， 它 与 电子 表格 非常 相似 ， 但 数据 模 
型 基于 类 型 ， 包 含 相互 作用 和 可 扩展 性 。 














V 数据 建 模 是 建立 数据 模型 的 过 程 ， 需 要 很 多 与 技术 无 关 的 技能 ， 如 专 
心 聆 听 ， 尽 可 能 提出 大 量 问题 ， 甚 至 耐心 。 





` 











笼统 地 讲 


数据 模型 是 精确 的 


数据 建 模 是 构建 应 用 程序 的 必要 组 成 部 分 。 数 据 模型 之 所 以 如 此 重 
要 ， 是 因为 它 所 带 来 的 两 大 核心 价值 一 交流 性 及 精确 性 。 数 据 模 型 可 以 
有 效应 用 于 业务 及 应 用 程序 开 友 领域 ， 本 章 则 通过 讲述 数据 模型 在 这 两 
个 领域 的 使 用 ， 阐 明 数 据 模 型 的 两 大 核心 价值 ， 你 将 学 习 到 数据 模型 对 
交流 的 促进 作用 和 能 削弱 数据 模型 精确 性 的 3 种 情形 。 





2.1 交流 性 


来 目 不 同 部 门 、 职 能 区 域 ， 以 具有 不 同 技术 背景 和 业务 经 验 的 各 类 
人 员 时 第 需要 就 业务 问题 进行 讨论 并 最 终 做 出 决策 。 讨 论 中 ， 需 要 明确 
对 方 对 诸如 “客户 “销售 ”等 这 类 概念 的 观点 。 数 据 模型 作为 一 种 理想 的 
工具 ， 可 以 有 效 达到 理解 、 记 录 并 最 终 协 调 不 同 观 点 的 目的 。 








当 我 号 在 异国 ， 无 法 进行 言语 交流 时 ， 那 位 加 油 站 服务 员 为 我 绘制 
的 地 图 模型 ， 使 我 明确 了 如 何 抵达 目的 地 。 无 论 我 们 想 尝 试 着 去 了 解 某 
一 业务 中 的 一 些 重要 概念 如 何 与 其 他 概念 相关 联 ， 还 是 想 了 解 一 个 已 经 
使 用 了 近 20 年 的 订单 处 理 系统 的 运作 ， 数 据 模 型 都 是 一 个 用 于 解释 信息 
的 理想 工具 。 


借助 数据 模型 ， 我 们 可 以 在 不 同 的 细节 水 平 上 交流 相同 的 信息 。 例 
如 ， 前 不 久 我 们 构建 了 一 个 用 于 描述 快餐 领域 消费 者 间 相 互 作 用 和 影 啊 
的 高 层次 数据 模型 。 于 是 ， 当 有 消费 者 电话 投诉 公司 产品 时 ， 我 们 所 构 
建 的 模型 将 存储 该 投诉 以 及 与 其 相关 的 信息 。 可 以 看 出 在 这 个 项 目 中 ， 
那些 重要 的 商务 客户 就 与 我 们 建立 的 这 个 高 层次 数据 模型 所 展示 的 内 容 
相关 联 。 数 据 模 型 有 助 于 限定 项 目 范 围 ， 帮 助理 解 诸 如 客户 、 产 品 及 相 
互 作用 等 关键 观念 ， 帮 助 建立 融洽 的 业务 关系 。 几 个 月 之 后 ， 我 们 使 用 
更 细 化 的 模型 来 描述 消费 者 间 的 相互 作用 信息 Cconsumer-interaction 
information) ， 并 回 业 务 报表 制作 者 说 明 ， 在 每 一 种 选择 条 件 下 ， 哪 些 
言 恩 将 出 现在 报表 中 。 

















基于 数据 建 模 的 交流 ， 并 非 只 是 在 建 模 结束 后 才 开始 的 。 事 实 上 ， 


伴随 着 数 据 建 模 进程 ， 需 要 更 多 的 交流 和 知识 分 诗 ， 即 交流 沟通 在 建 模 
中 与 建 模 后 都 同样 具有 价值 。 下 面 让 我 们 一 起 领略 建 模 过 程 和 建 模 结 果 
所 带 来 的 交流 价值 的 更 多 细节 。 


2.1.1 建 模 过 程 中 的 交流 





在 建立 数据 模型 的 过 程 中 ， 我 们 必须 分 析 数 据 及 数据 间 的 关系 ， 我 
们 别 无 选择 ， 必 须 对 所 要 模型 化 的 内 容 具 有 清晰 的 认识 。 人 们 在 建 模 过 
程 中 ， 相 互 挑战 、 质 疑 ， 从 而 获得 与 术语 、 假 设 、 规 则 和 概念 相关 的 大 


量 知 识 。 


在 为 一 家 大 型 制造 业 公 司 建立 配方 管理 系统 (recipe management 
system) 数据 模型 的 过 程 中 ， 我 惊讶 地 目睹 了 具有 多 年 工作 经 验 的 项 目 
组 成 员 就 “组 件 ”〈Ingredient) 的 概念 和 “原材料 ”(Raw Material) 的 概 
念 是 否 存 在 差别 进行 辩论 ， 经 过 30 分 钟 有 关 组 件 与 原材料 的 讨论 ， 每 一 
位 参加 建 模 的 人 员 都 从 中 受益 ， 当 结束 建 模 会 话 〈modeling session) 
时 ， 他 们 都 对 配方 管理 有 了 更 深入 的 理解 。 又 如 ， 以 模型 化 名 片 为 例 ， 
在 建 模 过 程 中 ， 将 学 习 到 许多 有 关 人 员 、 公 司 和 联系 人 管理 的 共识 。 





2.1.2 ” 建 模 过 程 后 的 交流 


创建 并 完成 的 数据 模型 是 讨论 在 应 用 程序 中 哪些 模块 应 该 被 构建 的 
基础 ， 甚 至 更 底层 的 ， 借 以 数据 模型 讨论 业务 流程 或 程序 功能 模块 如 何 
运作 。 数 据 模 型 像 一 张 可 反复 使 用 的 地 图 ， 无 论 是 分 析 师 、 建 模 者 ， 还 
是 开发 者 ， 都 可 以 利用 它 ， 了 解 他 们 各 自 关心 的 对 象 如 何 工作 ， 正 如 第 
1 位 地 图 制作 师 需 要 经 历 艰 昔 的 学 习 ， 才 能 准确 记录 下 地 理 景观 ， 为 他 
人 导航 。 与 此 极其 相似 的 是 建 模 者 也 需要 经 历 类 似 的 训练 〈 痛 兰 但 却 有 


am) 以 便 让 其 他 人 能 够 理解 一 个 信息 景观 〈information landscape) 。 


当 我 准备 进入 一 家 大 型 制造 业 公 司 工 作 之 前 ， 我 的 新 任 主管 给 了 我 
一 本 公司 手册 ， 其 中 记录 了 一 组 与 公司 有 关 的 数据 模型 ， 当 我 阅读 了 好 
儿 明 之 后 ， 我 已 经 对 公司 业务 中 的 重要 概念 和 业务 规程 相当 熟悉 了 了。 所 
以 ， 在 我 工作 的 第 一 天 ， 我 已 经 掌握 了 大 量 关 于 公司 业务 运作 的 信息 ， 
甚至 当 同 事 们 提 及 一 些 专 有 术语 的 时 候 ， 我 也 能 熟知 它们 的 含义 。 





就 上 一 草 提 到 的 名 片 ， 一 旦 完成 相应 的 数据 模型 ， 其 他 人 就 可 以 通 
过 该 模型 了 解 联系 人 管理 了 。 


2.2 ”精确 性 


数据 建 模 的 精确 性 指 的 是 阅读 模型 时 ， 其 中 的 每 一 个 符号 和 条 目 都 
是 清晰 、 无 二 义 性 的 。 你 可 能 与 其 他 人 争议 所 使 用 的 规则 是 否 准确 ， 但 
这 与 我 们 所 强调 的 模型 的 精确 性 是 不 一 样 的 概念 。 换 言 之 ， 如 果 你 看 到 
模型 中 的 某 一 符号 并 说 “我 看 见 了 A”， 那 么 另外 一 个 看 到 这 一 符号 的 人 
不 可 能 说 “我 看 见 了 B”。 


再 回 到 那个 名 厂 的 例子 ， 假 设 我 们 定义 “联系 人 ”为 名 片上 所 罗列 的 
人 或 公司 ， 或 许 有 人 提出 “一 个 联系 人 有 多 个 电话 号 码 ”。 显 然 这 个 表述 
征 不 精确 的 ， 因 为 我 们 不 确定 一 个 联系 人 是 否 可 以 没有 电话 号 码 ， 或 者 
必须 有 一 个 电话 号 码 ， 或 者 必须 有 多 个 电话 号 码 。 类 似 地 ， 我 们 不 明确 
征 否 允许 出 现 一 个 未 与 任何 联系 人 关联 的 电话 号 码 ， 或 者 一 个 电话 号 码 
必须 属于 茶 一 位 联系 人 ， 或 者 可 以 属于 多 位 联系 人 。 数 据 模型 提出 的 精 
确 性 ， 要 求 将 这 些 模糊 的 表述 转换 为 以 下 断言 。 


每 一 位 联系 人 必须 和 一 个 或 多 个 电话 号 码 关 联 。 
每 一 个 电话 号 码 必须 属于 一 位 联系 人 。 





由 于 数据 模型 引入 了 精确 性 ， 所 以 无 需 试 图 花费 宝 吐 的 时 间 来 解释 
模型 ， 相 反 ， 时 间 可 以 用 来 讨论 、 验 证 一 些 与 建立 某 一 模型 相关 的 概 
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但 是 在 3 种 情况 下 ， 数 据 模 型 的 精确 性 可 能 降低 。 


1. IEX: 如 果 对 一 个 数据 模型 中 的 一 些 条 目 (terms〉 的 定义 ， 





缺乏 根据 或 压根 不 存在 ， 那 么 此 时 极 有 可 能 对 这 些 条 目 产 生 多 种 理解 。 
如 采 数 据 模 型 中 的 一 则 业务 规则 规定 每 一 位 雇员 〈Employee) 必须 拥有 
一 套 福 利 计 划 ， 同 时 又 将 “雇员 ?定义 为 兢 基 生物 形式 这 样 一 种 缺乏 现实 
意义 的 表述 ， 那 么 我 可 能 认为 “雇员 ”包括 “工作 申请 人 ”， 而 你 可 能 认为 
不 包括 “工作 申请 人 (Job Applications) ”所 以 你 我 之 间 必 将 有 一 位 是 
错误 的 。 








2. 伪 数 据 : 第 2 种 情形 出 现在 当 菜 一 数据 超出 了 常规 的 取 值 ， 而 我 
们 又 希望 将 其 引入 特定 的 数据 记录 中 。 一 个 绕 开 数据 模型 严谨 性 (rigor 
of data model) 的 老 把 戏 是 扩大 数据 模型 可 能 包含 的 数据 值 。 例 如 ， 出 
于 某 种 考虑 ， 要 求 联 系 人 必须 有 至少 一 个 电话 号码 ， 而 如 果 要 添加 到 应 
用 程序 的 联系 人 并 没有 电话 号 码 ， 那 么 某 位 程序 使 用 者 可 能 为 该 联系 人 
创建 诸如 “不 可 用 ”99? 或 其 他 假 电 话 号 码 ， 该 联系 人 最 终 被 添加 进 了 应 
用 程序 。 这 个 例子 中 ， 使 用 伪 数 据 将 一 位 没有 电话 号 码 的 联系 人 添加 进 
了 应 用 ， 从 而 违背 并 规避 了 我 们 最 初 制定 的 业务 规则 。 














3. 模糊 或 缺失 的 标签 : 阅读 一 个 数据 模型 类 似 于 阅读 一 本 书 ， 应 
该 有 正确 的 句子 结构 ， 动 词 是 句子 中 非常 重要 的 组 成 部 分 。 对 于 数据 模 
型 ， 这 些 动词 用 来 描述 模型 中 一 些 概念 间 的 相互 关联 。 以 “客户 
(Customer) ”和 “订单 (Order) ”这 组 概念 为 例 ， 可 以 通过 动词 “ 订 
We” (place) 把 它们 相互 关联 ， 即 “一 位 客户 可 能 会 订购 一 个 或 多 个 订 
单 ?。 而 诸如 “联系 ”有 ?等 模糊 的 动词 ， 或 者 缺少 动词 ， 将 降低 整个 数 
据 模型 的 精确 性 ， 正 如 我 们 不 能 准确 理解 一 个 句子 的 含义 一 样 。 


数据 模型 的 精确 性 还 源 于 使 用 了 一 组 标准 的 符号 集合 ， 那 家 加 油 站 
服务 员 为 我 绘制 的 交通 图 使 用 了 标准 得 号 ， 于 是 人 人 都 能 理解 。 我 们 马 


上 融会 学 到 一 些 数据 模型 中 使 用 的 标准 符号 。 


2.3 ”使 用 数据 模型 


从 传统 的 角度 来 讲 ， 不 仅 要 求 对 一 个 新 的 应 用 进行 不 断 的 分 析 与 设 
计 ， 以 明确 所 有 满足 该 项 目的 必 备 条 件 ， 还 应 该 对 现 有 数据 库 具 有 完 
整 、 正 确 的 认识 ， 并 在 此 基础 上 完成 数据 模型 的 构建 。 由 于 模型 的 精确 
性 ， 数 据 模型 还 可 以 被 用 于 以 下 几 种 情况 。 


理解 已 有 应 用 程序 。 数 据 模型 提供 了 一 个 简单 而 精确 的 视角 ， 用 来 
观察 某 个 应 用 程序 所 涉及 的 概念 。 我 们 可 以 通过 考察 一 个 现 有 应 用 程序 
的 数据 库 ， 并 根据 该 数据 库 结 构 创 建 出 一 个 数据 模型 。“ 逆 同 工 
fE” (reverse engineering) 这 一 专业 术语 ， 即 表示 根据 现 有 的 应 用 构建 
出 数据 模型 的 过 程 。 不 久 前 ， 一 家 制造 业 机 构 需 要 将 一 个 已 使 用 了 25 年 
的 应 用 系统 迁移 到 一 个 新 的 数据 库 平 台 ， 对 于 这 个 庞大 的 应 用 系统 ， 为 
了 和 擎 握 理 解 它 的 结构 ， 我 们 将 数据 库 逆 癌 工 程 为 一 个 数据 模型 。 


风险 管理 。 通 过 数据 模型 可 以 获取 一 些 概念 及 概念 间 的 相互 作用 ， 
并 且 这 些 概念 及 相互 作用 受到 程序 、 项 目 开 发 的 影响 。 对 一 个 现 有 应 用 
程序 进行 结构 性 添加 或 修改 将 产生 什么 影响 ” 有 多 少 应 用 程序 结构 需要 
备份 ? 现在 有 很 多 机 构 购买 一 个 软件 后 会 再 对 其 进行 和 目 定义 修改 。 影 啊 
分 析 Cimpact analysis) 是 进行 风险 管理 的 一 种 方法 ， 借 助 数 据 模 型 进行 
影响 分 析 ， 来 明确 对 所 购买 的 软件 进行 结构 修改 会 产生 什么 影响 。 











了 解 业 务 。 开 展 一 个 大 型 项 目 开发 的 必要 条 件 是 在 了 解 应 用 程序 如 
何 辅助 业务 开展 之 前 ， 你 最 好 先 去 了 解 相关 的 业务 流程 。 例 如 ， 在 开发 
订单 录入 系统 之 前 ， 得 先 了 解 订单 录入 的 处 理 过 程 。 我 最 欣 和 车 的 一 句 话 





源 自 威廉 :肯特 (William Kent) 1978 年 所 写 的 一 篇 名 为 “数据 与 实 

BH” (Data and Reality) 的 文章 ， 文 中 当 肯 特 论 述 到 创建 一 个 数据 库 来 存 
储 图 书信 息 所 需要 的 步骤 时 ， 他 写 到 : 所 以 需要 再 次 强调 的 是 如 果 计 划 
创建 一 个 图 书 数据 库 ， 在 还 未 了 解 某 个 概念 的 准确 含义 之 前 ， 最 好 在 所 
有 用 户 中 达成 共识 ， 如 什么 是 “一 本 书 ”。 





培训 团队 成 员 。 当 新 成 员 想 要 尽快 跟 上 进度 或 开发 者 想 要 了 解 需求 
时 ， 数 据 模型 可 以 作为 一 个 非常 有 效 的 阐述 工具 。 一 位 新 人 无 论 何 时 加 
入 我 们 的 部 门 ， 我 都 会 花费 一 些 时 间 ， 通 过 一 系列 数据 模型 尺 可 能 快 地 
给 他 传授 一 些 相关 概念 。 


249% )\2) ee ie la 


在 你 所 在 的 组 织 中 找到 一 位 数据 模型 的 非 信仰 者 ， 并 试图 转变 他 。 
你 都 碰 到 了 哪些 障碍 ? 你 是 否 说 服 了 他 们 ? 














V 数据 建 模 的 两 大 核心 价值 是 交流 性 及 精确 性 。 





V 无 论 是 建 模 中 ， 还 是 建 模 完 成 后 ， 都 需要 进行 交流 、 沟 通 。 








V 如 果 存 在 弱 定 义 、 伪 数据 、 模 糊 或 缺失 标签 等 3 种 情况 ， 数 据 模型 的 
精确 性 将 会 降低 。 


























V 交流 性 和 精确 性 使 得 数据 模型 成 为 一 种 构建 应 用 程序 的 出 色 工 具 。 











V 数据 模型 还 可 以 被 应 用 于 理解 已 有 应 用 程序 、 了 解 业 务 、 执 行 影响 分 
析 和 培训 团队 成 员 。 


二 











PI 哪些 相机 设置 也 适用 于 数据 模型 





人 We eer | 


相机 设置 


变焦 、 对 焦 、 定 时 器 、 滤 镜 
数据 模型 也 一 样 。 


本 章 将 数据 模型 与 相机 比较 ， 解 析 4 种 相机 上 的 设置 ， 和 它们 完美 诠 
释 了 数据 模型 ， 理 解 这 些 设置 对 数据 模型 的 影响 ， 将 有 助 于 增加 一 个 应 
用 项 目 成 功 的 几率 。 同 时 ， 本 章 还 对 比 了 3 个 层次 上 的 图 像 格式 ， 从 而 
理解 概念 模型 、 逻 辑 模 型 和 物理 模型 。 








3.1 数据 模型 与 照相 机 


一 个 相机 上 可 以 使 用 很 多 设置 ， 来 确保 拍 出 动人 的 画面 。 想 象 一 

， 你 正 用 相机 瞄准 一 个 美丽 的 落日 场景 ， 即 使 面 对 同 一 场景 ， 如 宁 使 
ony 定时 需 或 变焦 设置 ， 那 么 你 可 能 也 会 拍 到 完全 不 同 的 照 
Fo 例如， 你 可 以 推 远 镜 尖 以 捕获 尽 可 能 多 的 落日 画面 ， 还 可 以 拉 近 镜 
头 ， 将 画面 集中 在 一 位 在 落日 中 漫步 的 游客 的 里 上 ， 这 完全 取决 于 你 想 
要 将 什么 呈现 在 照片 中 。 








变焦 、 对 焦 、 定 时 器 、 滤 镜 是 与 相机 有 关 的 4 种 设置 ， 它 们 都 可 以 
被 直接 变换 到 数据 模型 上 ， 如 图 3.1 所 示 ， 每 种 相机 设置 都 对 应 于 一 个 
数据 模型 的 特征 。 


定时 器 转换 为 时 间 





变焦 转换 为 范围 
对 焦 转 换 为 抽象 
滤 镜 转换 为 功能 


图 3.1 相机 设置 向 数据 模型 的 变化 





通过 变焦 设 定 ， 可 以 允许 摄影 者 捕获 一 个 广阔 的 场景 而 忽略 一 些小 
细 闻 ， 或 者 捕获 一 个 强调 细 市 的 狭 罕 范围 。 类 似 地 ， 对 数据 模型 的 范围 
(scope) 设置 可 以 改变 一 个 数据 模型 所 能 呈现 的 信息 量 大 小 。 相 机 的 
对 焦 设 置 可 以 决定 照片 中 的 景物 是 锐 化 的 (sharp〉， 还 是 模糊 的 
(blurry) 。 类 似 地 ， 对 模型 的 抽象 (abstract) 设置 则 可 以 使 用 诸如 同 
类 (party) ~ FF (event) 等 通用 概念 来 “模糊 ”(blur〉 概念 间 的 区 
别 。 定 时 器 可 以 用 来 设 定 一 个 实时 快门 ， 或 一 段 时 间 之 后 的 快门 。 类 似 
地 ， 对 数据 模型 的 时 间 Ctime) 设置 则 可 以 用 来 获取 一 个 当前 的 视角 或 
未 来 一 段 时 间 后 的 视角 。 渡 镜 设 置 可 以 用 来 调整 整个 画面 的 外 观 ， 产 生 
某 种 特定 的 视 沉 效果。 类似 地 ， 数 据 模型 的 功能 (function〉 设置 则 可 





以 用 来 将 模型 调整 到 业务 视觉 或 应 用 程序 视角 。 


同时 ， 不 能 忽略 图 像 类 型 的 重要 性 。 摄 影 校 样 (proof sheet) 允许 
在 一 张 纸 上 展示 所 有 的 图 像 ， 而 底 厂 为 Raw 格 式 的 图 像 ， 其 可 以 输出 很 
多 种 图 像 格式 ， 包 括 胶 上 请、 约 灯 片 或 数字 图 像 。 类 似 地 ， 相 同 的 信息 图 
像 (information image) 能 够 存在 于 数据 模型 的 概念 、 逻 辑 、 物 理 等 3 个 
不 同 的 细节 层次 上 。 

哪 种 设置 适合 于 你 的 模型 ? 正如 落日 下 的 摄影 ， 这 取决 于 你 想 要 捕 
获 什 么 。 用 适当 的 模型 设置 匹配 你 的 模型 目标 ， 可 以 提升 数据 模型 以 及 
它 所 文 撑 的 应 用 项 目的 质量 。 


3.2 ”范围 


数据 模型 和 相片 都 有 相应 的 边界 ， 边 界 决定 了 能 够 被 显示 的 事物 。 
一 张 照片 可 以 捕捉 到 我 的 小 女儿 正 享受 冰淇淋 时 的 情景 (实际 上 ， 她 的 
整个 面部 都 在 享受 着 冰淇淋 ) ， 或 者 可 以 捕捉 到 我 女儿 及 其 所 处 的 环 
境 ， 如 冰淇淋 店 。 类 似 地 ， 数 据 模 型 可 以 只 包含 索赔 过 程 Claims 
processing) ， 或 者 还 可 以 囊括 所 有 保险 业务 中 概念 。 典 型 的 情况 下 ， 
数据 模型 范围 可 以 是 一 个 部 门 、 一 个 组 织 或 一 个 行业 。 








部 门 CEE) 。 最 篆 见 的 建 模 任务 类 型 是 工程 级 范围 (project- 
level scope) ， 工 程 是 完成 软件 开发 任务 的 计划 ， 经 各 由 一 组 在 指 
定 日 期 之 前 可 交付 的 成 果 所 定义 。 例 如 ， 可 以 包括 销售 数据 集 市 
(sales data mart) 、 经 纪 人 交易 应 用 (broker trading 

application) 、 预 定 系 统 (reservation system) 及 对 现 有 应 用 的 加 
TH o 

组 织 〈 应 用 程序 ) 。 应 用 是 一 种 大 型 的 、 集 中 组 织 的 计划 ， 其 中 
可 能 包含 多 个 工程 。 通 常 应 用 具有 起 始 日 期 ， 但 如 采 成 功 ， 则 没有 
结束 日 期 。 应 用 可 能 是 非常 复杂 且 需 要 长 期 模型 化 的 任务 。 例 如 ， 
可 以 包括 数据 仓库 (data warehouse) 、 操 作 数 据 存 储 (operational 
data store) 及 客户 关系 管理 系统 (customer relationship management 











system) 。 

行业 。 一 份 行业 计划 被 设计 ， 旨 在 获取 行业 中 的 一 切 ， 如 制造 业 
或 银行 业 。 很 多 行业 都 在 进行 大 量 的 工作 ， 致 力 于 共享 一 个 共用 的 
数据 模型 。 如 健康 卫生 和 电信 等 行业 联盟 ， 都 在 从 事 共 用 数据 模型 





结构 的 开 及 ， 这 类 共用 纤 东 应 用 程序 开发 以 及 方便 同行 业 
中 不 同 组 织 间 的 信息 共 


3.3 ”抽象 


一 副 照 片 可 以 是 模糊 或 清晰 的 。 类 似 于 如 何 对 照相 机 进行 对 焦 ， 使 
得 图 片 变 得 锐 化 或 模糊 ， 模 型 的 抽象 设置 允许 你 表现 “ 锐 化 ”(concrete 
具体) 或 “模糊 ”(generic 通 用 〉 的 概念 。 


通过 重 定义 和 对 模型 中 的 一 些 属 性 、 实 体 、 关 系 进行 合并 ， 得 到 一 
些 通用 的 概念 ， 这 样 为 数据 模型 带 来 一 定 的 灵活 性 。 抽 象 是 指 去 除 部 分 
细 市 而 保留 一 些 重要 的 属性 、 概 念 或 主题 的 必要 本 质 ， 从 而 扩展 适用 
性 ， 满 足 更 宽泛 的 应 用 需求 。 通 过 去 除 细节 ， 消 除 分 卜 ， 改 变 我 们 看 待 
这 些 概念 或 主题 的 方式 ， 此 时 我 们 或 许可 以 看 到 那些 之 前 不 太 明 显 ， 甚 
至 未 曾 肥 现 的 东西 。 例 如 ， 可 以 将 “员工 “顾客 ”抽象 为 一 个 更 通用 
的 < 人 ”的 概念 ， 人 可 以 担任 不 同 的 角色 ， 员 工 、 顾 客 只 是 其 中 的 两 种 ， 
更 多 的 数据 模型 抽象 能 将 该 模型 变 得 更 宽泛 、 通 用 。 对 于 数据 模型 ， 概 
念 可 以 被 不 同 层 次 地 抽象 : “业务 云 ” 数 据 库 云 ?或 “地 面 上 ”。 











。 在 业务 云 中 。 在 这 一 级 别 的 抽象 中 ， 只 有 通用 的 概念 被 应 用 于 数 
据 模 型 ， 业 务 云 模型 通过 使 用 诸如 人 (Person) . 2H 
(Transaction) UX (Document) 等 通用 概念 ， 隐 藏 许多 现实 复 
杂 性 。 实 际 上 ， 当 使 用 业务 云 的 概念 时 ， 糖 末 公 司 和 保险 公司 变 得 
非常 相似 ， 倘 各 你 缺乏 对 某 一 业务 的 认识 ， 或 不 能 获取 到 一 些 业 务 
文档 和 资料 ， 一 个 业务 云 中 的 模型 将 能 很 好 地 运作 起 来 。 

在 数据 库 云 中 。 在 这 一 级 别 的 抽象 中 ， 只 有 通用 的 数据 库 
(database, DB) 概念 被 应 用 于 数据 模型 。 数 据 库 模 型 是 最 容易 被 
创建 的 ， 它 使 用 诸如 实体 〈Entity) 、 对 象 (Object) 和 属性 











(Attribute) 等 数据 库 概 念 。 如 有 宁 你 不 清楚 业务 如 何 开 展 ， 而 又 想 
要 履 盖 所 有 行业 的 所 有 和 领域， 那么 一 个 数据 库 云 中 的 模型 将 能 很 好 
地 运作 起 来 。 

。 在 地 面 上 。 这 类 模型 对 应 于 少量 的 业务 处 理 ， 并 使 用 尽 可 能 少 的 
数据 库 云 实体 ， 而 使 用 大 量 能 代表 具体 业务 术语 的 概念 。 比 如 数据 
模型 得 花费 大 量 时 间 来 创建 学 生 、 课 程 、 教 师 等 3 个 概念 ， 并 允许 
增加 一 些 具体 的 值 来 帮助 理解 业务 处 理 、 解 决 数 据 问 题 。 


3.4 时 间 


大 部 分 照相 机 具有 定时 器 功能 ， 使 得 摄像 者 可 以 在 设 定 定 时 器 后 ， 


快 跑 并 把 他 上 自己 也 拍摄 进 画 面 中 。 类 似 于 应 用 照相 机 定时 器 可 以 拍摄 一 
幅 当 前 或 一 段 时 间 之 后 的 场景 ， 数 据 模型 的 时 间 设 置 允 许 将 一 个 当前 或 
未 来 的 视角 表现 在 模型 上 。 





一 个 数据 模型 可 以 表示 当前 的 业务 运转 ， 也 可 以 表示 未 来 一 段 时 间 


后 可 能 的 业务 状况 。 








当前 。 一 个 珊 有 当前 设置 的 模型 可 以 获取 当前 业务 运作 的 信息 。 
即便 存在 一 些 陈旧 的 业务 规则 ， 它 们 也 得 出 现在 模型 中 ， 即 使 在 不 
入 的 将 来 这 些 规则 要 被 修改 。 另 外 ， 如 有 果 一 家 企业 正 计划 购 买 刀 一 
家 公司 ， 或 出 售 一 家 公司 ， 或 者 正在 改变 经 营 种 类 ， 那 么 当前 视图 
也 不 会 显示 任何 一 个 上 述 正 要 发 生 的 变化 ， 而 仅仅 只 能 表现 出 目前 
的 状况 。 

未 来 。 一 个 带 有 未 来 设置 的 模型 可 以 表现 未 来 任意 一 个 时 间 阶 段 
的 业务 。 通 常 这 种 模型 是 一 个 理想 状态 下 的 视角 ， 无 论 过 去 了 1 
年 、5 年 ， 还 是 10 年 ， 未 来 设置 总 能 体现 该 组 织 的 发 展 方向 。 如 果 
一 个 模型 需要 支持 茶 个 组 织 的 友 展 规划 和 战略 布局 ， 那 么 设 定 一 个 
未 来 设置 将 是 其 首选 。 我 曾经 作为 负责 人 为 一 所 大 学 构建 模型 ， 由 
于 有 大 量 的 应 用 迁移 要 在 一 年 内 完成 ， 所 以 这 个 模型 需要 表现 出 一 
年 以 后 的 情况 。 还 需 注意 的 是 对 于 大 部 分 组 织 ， 如 果 需 要 一 个 未 来 
的 视角 ， 通 常 必须 首先 创建 一 个 当前 的 视角 作为 起 始点 ， 这 样 做 没 
有 什么 不 受 ， 正 如 一 位 摄影 者 可 以 对 一 个 场景 拍摄 多 幅 照 片 ， 那 么 





























一 位 数据 模型 的 创建 者 也 可 以 用 不 同 的 设置 去 创建 多 个 模型 。 


3.5 ”功能 








滤 镜 是 一 组 履 盖 在 相机 镜头 上 的 塑料 和 玻璃 材质 的 滤 光 片 ， 可 以 用 
不 同 颜 色 的 滤 光 片 对 照片 进行 调整 ， 例 如 ， 让 照片 看 起 来 更 赣 或 更 绿 ， 
与 相机 滤 镜 可 以 改变 场景 的 外 观 一 样 ， 数 据 模 型 的 功能 设置 则 允许 一 个 
数据 模型 表现 为 业务 视角 或 功能 视角 。 我 们 正在 模型 化 一 个 业务 视角 下 
的 世界 ， 还 是 应 用 程序 视角 下 的 世界 ? 有 时 它们 一 致 ， 但 有 时 它们 有 很 
大 的 差别 。 








。 业务 。 这 种 过 涛 器 使 用 的 是 业务 术语 及 规则 ， 而 模型 呈现 与 应 用 
无 关 的 视角 ， 无 论 茶 一 机 构 是 用 文件 柜 存 储 信息 ， 还 是 使 用 最 有 效 
的 软件 系统 。 在 模型 中 ， 这 些 信息 将 会 被 一 些 业 务 概念 表示 。 

。 应 用 程序 。 这 种 过 滤器 使 用 的 是 应 用 程序 术语 及 规则 ， 是 用 应 用 
程序 的 观点 看 待业 务 运作 而 形成 的 视角 。 例 如 ， 应 用 程序 使 用 术 
语 “ 对 象 ” 来 表示 “产品 ”， 则 产品 会 以 “对 象 ” 的 形式 出 现在 模型 中 ， 
而 且 是 以 应 用 程序 定义 术语 的 方式 进行 定义 ， 而 不 是 用 业务 处 理 的 
方式 进行 定义 的 。 











3.6 格式 


正如 一 台 照 相机 可 以 用 多 种 不 同 的 格式 获取 图 像 ， 数 据 模型 的 格式 


设置 可 以 用 来 调整 模型 的 细节 水 平 ， 让 模型 呈现 出 很 宽泛 、 高 层次 的 概 
RILA] (conceptual view) 或 呈现 出 能 反映 更 多 细 市 的 逻辑 或 物理 视图 


(logical or physical view) 。 


。 概念 视图 。 通 常 当 一 组 照片 被 冲洗 时 ， 一 份 校 样 会 包含 每 一 幅 照 





片 的 绾 略图 ， 则 观察 者 可 以 用 一 张 相 纸 得 到 一 个 全 景 的 视角 ， 这 里 
的 全 景 视 角 类 似 于 概念 数据 模型 Cconceptual data model, 

CDM) 。 概 念 数据 模型 可 以 在 一 个 很 高 的 层次 上 表示 业务 ， 这 种 
很 宽泛 的 视图 仅 包 含 给 定 范 围 内 的 一 些 基 本 、 关 键 的 概念 。 这 里 
的 “基本 ”意味 着 在 一 天 的 交谈 中 一 些 概念 会 被 很 多 次 地 提 及 。“ 天 
BE” FR a id AKERS, PTI. ZR. Tee KK 
变 。 有 的 概念 是 所 有 组 织 通用 的 ， 如 “顾客 关 产 品 ? 和 “员工 ”>， 而 有 
的 概念 则 特定 于 某 一 行业 或 部 门 ， 如 保险 领域 中 的 “政策 *， 或 中 介 
行业 中 的 “交易 ”。 

逻辑 视图 。 在 数码 相机 问世 之 前 ， 一 卷 冲洗 过 的 胶片 可 以 得 到 一 
组 底片 ， 这 些 底片 可 以 用 来 很 好 地 观察 所 拍 相片 ， 这 里 底片 类 似 于 
逻辑 数据 模型 (logical data model, LDM) 。 逻 辑 数据 模型 描述 了 
一 份 详细 的 业务 解决 方案 ， 这 使 得 建 模 者 不 用 创建 与 软 便 件 实现 有 
关 的 复杂 数据 模型 ， 就 能 掌握 相应 的 业务 需求 。 

物理 视图 。 虽 然 底 片 是 一 种 很 好 的 观察 相片 的 视角 ， 但 它 其 实 并 
不 实用 。 例 如 ， 你 不 太 可 能 将 底片 置 于 相框 或 相册 中 拿 去 与 朋友 分 


























享 ， 你 应 该 转换 或 “实例 化 ”(instantiate) 底片 为 照片 、 约 灯 片 或 数 
字 图 像 。 相 似 的 ， 逻 辑 数据 模型 需要 被 修改 成 更 实用 的 物理 数据 模 
型 (physical data model, PDM) 。 它 是 逻辑 数据 模型 的 化 身 
(incarnation〉 或 实例 化 Cinstantiate) ， 类 似 于 照片 是 底片 的 化 
号 ， 物 理 数据 模型 表示 详细 的 技术 解决 方案 ， 是 对 特定 环境 的 优化 
(诸如 特定 的 软件 或 硬件 环境 ) 。 物 理 数据 模型 是 在 某 种 特定 环境 
下 ， 对 逻辑 模型 执行 力 的 修改 、 增 强 ， 在 该 环境 中 数据 将 被 创建 、 
维护 和 访问 。 











3.7 练习 3: 选择 正确 的 设置 


在 下 列 列 表 中 ， 为 每 种 情形 选 出 最 适当 的 设置 ， 参 考 答 案 在 书 的 后 
面 。 


1. 给 一 位 项 目 组 开发 人 员 解 释 现 存 的 联系 人 管理 系统 是 如 何 工作 


的 。 


数据 库 云 


























3. 获取 一 份 天 于 新 的 销售 数据 集 市 的 详细 需求 (数据 集 市 是 为 了 
满足 一 些 特定 用 户 需 求 而 设计 的 一 种 数据 仓库 〉。 




















v 照相 机 上 有 4 种 设置 ， 变 焦 、 对 焦 、 定 时 器 、 滤 镜 ， 它 们 都 可 以 被 直 
接 转换 到 数据 模型 上 。 变 焦 可 以 转换 为 数据 模型 的 范围 。 对 焦 可 以 转换 为 数 
据 模型 的 抽象 。 定 时 器 转换 为 时 间 设 置 ， 用 来 决定 数据 模型 获取 当前 的 视 
图 ， 还 是 未 来 的 视图 。 过 滤器 转换 为 功能 设置 ， 用 来 决定 数据 模型 获取 的 是 
业务 视角 ， 还 是 应 用 程序 视角 。 





















































V 用 适当 的 模型 设置 匹配 建立 模型 的 目标 ， 可 以 提升 数据 模型 以 及 它 所 
支撑 的 应 用 项 目的 质量 。 























V 不 要 忘记 关于 图 像 格 式 的 可 选项 ! 人 们 更 喜欢 去 看 一 份 校 样 〈 概 念 数 
据 模 型 ) 、 底 片 〈 逻 辑 数据 模型 ) ， 还 是 图 片 〈 物 理 数 据 模型 ) ? 























第 2 部 分 ”数据 模型 要 系 





第 2 部 分 将 解释 数据 模型 中 所 使 用 的 符号 及 文本 。 第 4 章 解 释 实 体 ， 
第 5 章 则 关于 属性 ， 第 6 章 讨论 关系 ， 第 7 章 说 明 键 。 当 完成 了 本 部 分 的 
学 习 ， 你 将 可 以 读 懂 任意 规模 、 复 寻 度 的 数据 模型 。 


第 4 章 介绍 了 实体 (entity〉 的 定义 并 讨论 了 不 同 种 类 的 实体 ， 实 体 
实例 也 将 于 本 章 介 绍 。 同 时 ， 对 实体 上 存在 的 3 种 层次 一 一 概念 、 逻 
辑 、 物 理 也 做 了 相应 的 说 明 。 进 一 步 地 还 介绍 了 与 弱 实 体 (weak 
entity) 相关 的 概念 。 


第 5 章 介 绍 了 属性 的 定义 并 讨论 了 域 的 概念 ， 而 且 还 给 出 了 3 种 不 同 
域 类 型 的 实例 。 





第 6 章 介 绍 了 规则 和 关系 的 定义 ， 数 据 规则 有 别 于 行为 规则 。 鸭 
外 ， 基 数 和 标签 也 将 会 被 前 述 。 由 此 使 得 能 像 阅 读 小 说 那样 轻松 地 读 懂 


任何 数据 模型 。 递 归 关 系 (recursive relationships) 、 子 类 型 
(subtyping) 等 关系 类 型 也 将 被 讨论 。 


第 7 章 介 绍 了 键 的 定义 ， 并 对 候选 键 、 主 键 、 备 用 键 等 术语 加 以 区 
分 ， 而 且 还 将 介绍 代理 键 、 外 键 的 定义 ， 并 对 它们 的 重要 性 加 以 解析 。 





有 趣 的 概念 


谁 、 什 么 、 何 时 、 何 地 、 为 何 及 如 何 
实体 比比 皆 是 。 


当 我 在 教室 中 来 回 践 步 ， 想 看 看 是 否 有 学 生 会 有 疑问 时 ， 我 注意 到 
坐 在 最 后 一 排 的 一 名 同学 已 经 完成 了 练习 ， 我 走 到 她 的 座位 劳 ， 只 看 见 
她 在 纸 上 画 了 几 个 矩形 框 ， 其 中 有 一 个 大 操 的 矩形 框 里 面 写 着 “生产 ”， 
我 询问 她 如 何 理 解 所 定义 的 “生产 *”， 她 回答 说 :“ 生 产 是 一 个 将 原材料 
加 工 成 最 终 产 品 的 过 程 ， 所 有 的 生产 步骤 都 被 包含 在 这 个 矩形 框 中 ”。 











事实 上 ， 数 据 模 型 中 的 矩形 ， 即 实体 ， 不 是 被 设计 用 来 表示 或 包含 
处 理 的 。 相 反 ， 实 体 是 用 来 表示 在 处 理 中 所 使 用 到 的 一 些 概 念 。 那 名 同 
学 所 设计 的 模型 里 的 “生产 ”实体 ， 事 实 上 可 以 被 最 终 转 化 成 其 他 的 几 个 
实体 ， 包 括 “ 原 材料 “最 终 货 物 “ 机 器 “生产 计划 ”等 。 








本 章 定 义 了 实体 的 概念 ， 并 讨论 了 实体 的 不 同 种 类 〈 谁 、 什 么 、 何 


时 、 何 地 、 为 何 及 如 何 )， 同 时 ， 对 实体 的 3 个 层次 一 概念 、 逻 辑 、 物 
理 加 以 解释 ， 进 一 步 地 ， 还 介绍 了 与 弱 实 体 相 关 的 概念 。 


4.1 实体 的 说 明 


一 个 实体 表示 的 是 对 于 业务 非常 重要 或 值得 3 
的 信息 集合 。 


bN H o 


: 谁 、 什 么 








及 相应 的 实例 。 


企业 有 益 





对 


为 : 
对 业务 而 言 重要 的 东西 


对 





的 人 或 组 织 ， 即 “业务 中 ， 谁 
eg ae 角色 关 
， 如 “顾客 ?或 “供应 丙 ” 














企业 有 益 的 产品 或 服务 ， 通 各 可 以 理解 
组 织 会 把 什么 保留 在 它 的 业务 内 ， 即 


是 什么 























企业 有 益 的 日 程 或 时 间 间 隔 ， 即 业务 何 





时 运作 


对 


企业 有 益 的 位 置 ， 位 置 可 以 是 





个 实际 








的 地 点 ， 也 可 以 是 一 个 电子 化 的 虚拟 场 


所 ， 





即 业 务 在 哪 开 展 





天 取 的 事物 及 与 之 相关 


每 个 实体 都 由 一 个 名 词 或 名 词 词 组 定义 ， 并 符合 六 大 种 类 
、 何 时 、 何 地 、 为 何 及 如 何 。 表 4.1 为 实体 种 类 的 定义 


表 4.1 实体 信息 


Employee. Patient. Player, 


Suspect. Customer. Vendor, 


Student. Passenger. 


Competitor, 


Author 


Service. Raw Material. 


Finished Good. Course, 


Product, 
Song, 
Photograph. Title 


Time, Date. Month, Quarter, 


Year. Semester. Fiscal Period. 


Minute 


Mailing Address, Distribution Point, 
Website URL. IP Address 


Order, Return, Complaint, 


为 | 对 企业 有 益 的 事件 或 交易 ， 这 些 事件 保 证 [ONE Reun Com 
fal | 业务 的 运转 ， 即 业务 运转 的 原因 ithdrawal、Deposit、 








Compliment. Inquiry, Trade, Claim 


对 企业 有 益 的 事件 的 文档 ， 文 档 用 来 记录 | Invoice, Contract. Agreement, 
事件 ， 如 “采购 订单 "里 记录 了 一 次 订购 事 | Purchase Order, Speeding Ticket, 





件 ， 即 在 业务 中 事件 如 何 被 跟踪 Packing Slip, Trade Confirmation 





实体 实例 是 一 个 具体 实体 的 呈现 或 者 说 是 实体 的 值 。 试 想 将 一 个 电 
子 表 格 当 作 一 个 实体 ， 其 中 列 标题 代表 实体 应 该 记录 的 一 些 信 息 ， 每 个 
电子 表格 行 包含 的 实际 值 则 为 一 个 实体 实例 。 例 如 ， 实 体 “ 顾 客 ” 可 以 被 
一 些 如 Bob、Joe、Jane 等 具体 的 姓名 实例 化 ， 实 体 “ 账 户 ” 则 可 能 有 诸如 
Bob 的 支票 账户 、Bob 的 储蓄 账户 、Joe 的 经 纪 人 账户 等 实例 。 











4.2 ”实体 类 型 








数据 模型 之 美 在 于 你 可 以 根据 不 同 的 受众 把 相同 的 信息 以 不 同 的 细 
节 水 平 呈现 出 来 。 上 一 章 介 绍 了 3 种 细节 水 平 : Bias. HR. HH. K 
体 是 所 有 3 个 细节 水 平 的 组 成 部 分 。 





实体 可 以 在 概念 、 逻 辑 和 物理 3 种 层次 上 被 描述 。 概 念 意味 独 高 层 
次 的 业务 流程 的 解决 方案 或 应 用 程序 频 系 定义 的 范围 和 重要 术语 。 氨 辑 
意味 着 业务 流程 的 详细 解决 方案 或 应 用 程序 。 物 理 意 味 着 应 用 程序 详细 
的 技术 解决 方案 。 





那些 基本 、 关 键 的 业务 信息 ， 才 能 与 实体 的 概念 层 相 关 ， 而 什么 是 
基本 且 关 键 的 信息 ， 这 很 大 程度 上 取决 于 所 关注 的 范围 。 在 一 个 普 训 的 
范围 内 ， 有 一 些 最 第 见 的 共识 概念 ， 例 如 ,， “顾客 “产品 * 和 “员工 ”"。 如 
果 将 范围 缩小 一 点 ， 一 个 给 定 的 行业 可 能 会 产生 一 些 特定 的 概念 ， 对 于 
广告 行业 , “宣传 ”可 以 是 一 个 有 效 的 概念 ， 但 对 于 其 他 行业 则 不 尽 然 。 








在 逻辑 层 上 描述 的 实体 ， 使 用 了 比 概念 层 更 多 的 细节 来 描述 业务 。 
通常 ， 一 个 概念 实体 可 以 被 表示 成 多 个 逻辑 数据 模型 实体 ， 逻 辑 实体 中 
包含 的 属性 (attributes) 将 在 第 5 章 讨 论 。 





在 物理 层 上 ， 实 体 对 应 于 某 种 特定 技术 的 对 象 。 例 如 ， 关 系 型 数据 
库 管 理 系统 RDBMS 中 的 数据 库 表 ， 又 如 NoSQL 数 据 库 MongoDB 中 的 集 
@ (collection) 。 物 理 层 与 逻辑 层 非 常 相似 ， 但 是 往往 需要 一 些 技术 在 
数据 库 执行 性 能 及 数据 存储 上 找到 相应 的 解决 方案 。 物 理 实体 还 包含 一 
些 与 特定 数据 库 相 关 的 信息 ， 例 如 ， 属 性 的 格式 或 长 度 〈 作 者 的 姓氏 ， 








长 度 50 个 字符 ) ， 或 者 属性 是 否 需要 被 赋值 作者 税 号 不 为 空 ， 故 需要 
赋值 ， 作 者 生日 可 为 空 ， 故 可 以 不 赋值 》。 


在 关系 型 数据 库 (RDBMS) 中 ， 物 理 实体 对 应 于 数据 库 表 或 视 
图 。 而 在 NoSQL 数 据 库 中 ， 物 理 实体 的 转换 取决 于 底层 技术 ， 例 如 ， 在 
一 个 基于 文档 的 数据 库 MongoDB 中 ， 实 体 对 应 于 集合 “collection ) 。 
而 通用 术语 结构 (structure〉 指 的 是 底层 数据 库 组 件 ， 与 具体 的 RDBMS 
或 NoSQL 数 据 库 解决 方案 无 基 。 





图 4.1 所 示 为 几 个 与 冰淇淋 店 有 关 的 实体 ， 每 个 实体 用 包含 实体 名 
的 矩形 框 表示 。 








冰淇淋 口味 











冰淇淋 大 小 











冰淇淋 订单 | 
Ra 





图 4.1 实体 的 表示 


需要 注意 的 是 有 两 种 类 型 的 窍 形 框 ， 例 如 ， 冰 淇 溧 口味、 冰淇淋 大 
小 那样 的 直角 矩形 框 ， 还 有 如 冰淇淋 订单 那样 的 加 角 和 矩形 框 。 这 里 并 不 
打算 用 过 时 的 建 模 术语 来 区 分 两 种 矩形 框 ， 只 需 明确 对 于 大 多 数 建 模 工 
具 来 次 ， 直 角 框 表示 强 实体 ， 圆 角 框 表示 弱 实 体 。 

















强 实 体 可 以 独立 存在 ， 用 来 表示 相对 独立 的 人 、 事 或 地 点 。 例 如 ， 
为 了 检索 东 位 特定 顾客 的 信息 ， 可 以 在 数据 库 中 使 用 顾客 号 进行 得 
找 。“ 这 是 Bob， 顾 客 号 为 123”。 巧 死 力 风味 的 冰淇淋 可 以 用 C 进 行 检 


索 ， 冰 淇 麻 大 小 为 两 十 的 信息 可 以 用 数字 2 进行 检索 。 


弱 实体 至 少 依赖 于 一 个 其 他 的 实体 ， 这 意味 着 如 条 不 引用 其 他 实体 
的 实例 ， 就 无 法 检索 弱 实 体 的 实例 ， 例 如 ， 冰 淇 淋 订 单 可 以 由 冰淇淋 口 
味 或 冰淇淋 大 小 ， 再 结合 冰淇淋 订单 中 的 系 些 内 容 (如 序号 ) 进行 检 
索 。 





数据 模型 是 一 种 交流 工具 。 理 解 强 实体 、 弱 实体 间 的 又 别 将 有 助 于 
我 们 理解 实体 间 的 关系 和 依赖 。 例 如 ， 在 阅读 数据 模型 时 发 现 冰 淇 淋 订 
单 是 依赖 于 冰淇淋 口味 的 弱 实 体 ， 于 是 在 软件 开发 过 程 中 就 应 该 确保 冰 
淇 淋 口味 信息 先 于 订单 提交 被 洪 加 ， 即 提交 一 份 巧 元 力 冰 淇 淋 订 单 之 
前 ， 作 为 冰淇淋 口味 的 “巧克力 ”需要 在 软件 系统 中 可 用 。 





4.3 练习 4: 定义 概念 


列举 3 个 你 所 在 机 构 的 概念 。 机 构 中 对 这 3 个 概念 是 否 有 唯一 共识 的 
定义 ? 如果 不 是 ， 为 什么 ?你 是 否 可 以 为 每 一 条 给 出 一 个 单独 的 定义 ? 


V 一 个 实体 表示 的 是 对 于 业务 非常 重要 或 值得 获取 的 事物 及 与 之 相关 的 
言 息 集 合 。 实 体 应 该 符合 六 大 种 类 之 一 : 谁 、 什 么 、 何 时 、 何 地 、 为 何 及 如 
何 。 





V 实体 由 名 词 或 名 词 词 组 定义 。 





V 实体 实例 是 一 个 具体 实体 的 呈现 或 者 说 是 实体 的 值 。 
V 实体 可 以 存在 于 概念 、 逻 辑 、 物 理 等 3 种 细节 水 平 上 。 


V 实体 可 分 为 强 实体 和 弱 实 体 。 








电子 表格 由 各 列 构成 ， 
属性 类 似 于 列 ， 
模型 无 处 不 在 。 


本 章 介绍 属性 的 概念 及 属性 可 存在 的 3 个 不 同 层次 一 概念 、 逻 辑 、 
物理 。 域 及 不 同类 型 的 域 也 将 被 讨论 。 


5.1 属性 的 解释 


属性 是 一 则 相对 独立 的 信息 ， 其 值 用 以 识别 、 摘 述 、 评 佑 实体 实 
例 。 例 如 ， 属 性 “索赔 号 ?可 以 识别 每 个 索赔 ， 属 性 “学 生 的 姓氏 ”用 来 摘 
述 学 生 。 属 性 “销售 总 额 * 用 来 评估 交易 中 获取 的 财政 收入 。 





以 电子 表格 为 例 ， 电 子 表格 中 的 列 标题 就 是 属性 。 每 个 列 标题 下 方 
一 个 个 单元 格 用 来 存储 相应 属性 的 值 。 我 们 可 以 将 电子 表格 中 的 列 标 
题 、 表 单 中 的 域 、 报 表 中 的 标签 都 理解 为 属性 。“ 冰 淇 淋 风 味 名 ”*“ 冰 湛 
淋 大 小 代码 ”是 关于 冰淇淋 店 的 属性 ， 而 “公司 名 “电话 号 码 ” 是 天 于 名 
片 的 属性 。 











5.2 属性 类 型 





与 实体 类 似 ， 属 性 也 可 以 在 概念 、 逻 辑 、 物 理 等 3 个 层次 上 加 以 擂 
述 。 概 念 级 属性 必须 是 对 业务 起 着 基本 且 又 关键 影响 的 概念 。 一 般 情况 
下 ， 属 性 不 被 当 作 概 念 ， 但 这 取 雇 于 业务 需求 ， 允 许 例 外 。 以 前 ， 我 曾 
为 一 家 通信 公司 提供 数据 建 模 服务 ， 在 其 他 应 用 中 电话 号 码 通 癌 被 视 为 
属性 ， 但 它 对 于 这 家 通信 公司 的 业务 却 非 常 重要 ， 所 以 电话 号 码 被 表示 
成 了 概念 数据 模型 中 的 概念 。 


逻辑 模型 中 的 属性 则 描述 的 是 业务 特征 。 每 个 属性 对 于 业务 解决 方 
案 都 有 不 同 程度 的 页 献 ， 并 且 与 任何 软 、 人 硬件 技术 无 关 。 例 如 ,，“ 冰 淇 
淋 口 味 名 ”就 是 一 则 逻辑 级 属性 ， 因 为 它 对 业务 解决 方案 有 重要 意义 ， 

而 且 并 不 取决 于 到 底 存 储 在 纸 质 文件 中 ， 还 是 存储 在 高 速 数 据 库 中 。 与 
物理 数据 模型 对 应 的 属性 可 以 被 理解 为 一 个 物理 “容器 "， 用 来 存储 数 
据 ， 属 性 “冰淇淋 口味 名 ”在 RDBMS 中 可 以 被 表示 为 ICECRM 表 中 的 
ICE_CRM_FLVR NAM 列 ， 或 者 在 MongoDB 数 据 库 中 被 表示 为 IceCream 
集合 中 的 字段 IceCreamFlavorName。 

















需要 注意 的 是 本 书 中 为 了 保持 文字 上 的 一 致 性 ， 我 们 使 用 的 是 “ 属 
PE” Cattribute) 。 但 在 实际 工作 中 ， 我 则 建议 使 用 那些 更 容易 让 用 户 接 
纳 的 术语 。 例 如 ， 有 的 业务 分 析 师 可 能 更 倾 癌 于 使 用 特征 〈property ) 
或 标签 Cabel) ， 而 有 的 数据 库 管理 员 或 许 更 习惯 使 用 列 〈column) 或 
字段 (field) 。 


5.3” 域 的 解释 


域 是 某 一 属性 所 有 可 能 取 值 的 集合 。 域 中 往往 还 包含 一 组 验证 标 
准 ， 使 得 域 可 以 被 多 个 属性 使 用 。 例 如 , “日 期 * 域 中 包括 所 有 的 合法 日 
期 ， 它 可 以 被 应 用 于 以 下 这 些 属性 。 


雇员 入 职 日 期 
订单 输入 日 期 
索赔 提交 日 期 
谍 程 开始 日 期 





如 果 属 性 与 域 相关 联 ， 那 么 该 属性 的 取 值 绝对 不 允许 超出 该 域 ， 域 
中 的 值 可 以 由 一 组 特定 的 数据 列表 指定 ， 也 允许 由 一 组 规则 指定 。 例 
On, “员工 性 别 * 可 以 由 取 值 为 “ 男 ” 和 “ 女 ” 的 域 限 定 。“ 员 工 入 职 日 期 * 可 
以 由 一 组 规则 限定 ， 如 取 规 则 为 “合法 日 期 ”， 则 其 可 能 取 值 如 下 。 


e February 15 ,2005 
e 25 January 1910 

e 20150410 

e March 10 ,2050 


由 于 员工 入 职 日 期 应 该 被 设 定 为 一 个 有 效 的 日 期 ， 故 February 30th 
被 排除 。 在 此 基础 上 ， 还 可 以 用 一 组 附加 规则 来 限定 其 域 。 例 如 ， 限 定 
员工 入 职 日 期 的 域 为 早 于 今天 ， 这 样 March 10 ,2050 被 排除 ， 又 如 果 限 
定 其 格式 为 YYYYMMDD (年 、 月 、 日 串联 日 期 格式 ) ， 除 了 20150410 
之 外 其 他 的 都 应 被 排除 。 还 可 以 使 用 精简 的 数据 集合 来 限定 员工 入 职 日 





期 的 域 ， 即 规定 该 日 期 必须 符合 星期 一 、 星期 二 、 星期 三 、 星期 四 、 星 
期 五 中 的 一 个 〈 典 型 的 工作 日 ) 。 








在 名 片 实例 中 ,“ 联 系 人 姓名 ”可 能 包含 数 干 种 ， 甚 至 数 百 万 种 取 
值 ， 如 图 1.2 给 出 的 4 张 名 片 ， 其 姓名 为 : 


e Steve Hoberman 
e Steve 

e Jenn 

e Bill Smith 


e Jon Smith 


姓名 域 应 该 需要 稍 作 精 简 ， 有 必要 明确 此 域 的 域 值 是 否 必 须 由 媳 和 
名 两 部 分 构成 ， 如 Steve Hoberman， 还 是 可 以 仅 包 含 名 ， 如 Steve。 该 域 
可 以 包含 公司 名 吗 ， 如 IBM? 这 个 域 是 否 允 许 出 现 数字 ， 而 不 仅仅 是 字 
母 ， 如 来 自 电影 星际 大 战 的 名 字 R2D2? 这 个 域 是 否 可 以 出 现 一 些 特殊 
的 字符 ， 如 O(+>?O(+>， 该 字符 串 是 音乐 王子 在 1993 年 把 他 的 名 字 变 成 
这 种 不 能 发 音 的 “ 爱 的 符号 ”。 























以 下 为 3 种 基本 的 域 类 型 。 


D 格式 域 将 数据 指定 为 数据 库 中 的 标准 类 型 ， 如 整 型 nteger) 、 
字符 型 (Character (30) ) 、 日 期 (Date) 等 都 是 格式 域 。 





D 列表 域 类 似 于 一 个 下 拉 列 表 ， 它 由 一 个 可 选 的 有 限 值 的 集合 组 
成 ， 列 表 域 是 格式 域 的 精简 ， 如 “订单 状态 代码 ”的 格式 域 可 以 被 置 为 
Character(10)， 在 此 基础 上 该 域 可 以 由 一 个 (Open, Shipped. Closed, 





Returned) 列表 域 进 一 步 精 简 。 


O 范围 域 的 设置 要 求 取 值 介 于 最 小 值 与 最 大 值 之 间 ， 例 如 , “订单 
交付 日 期 "必须 为 从 今天 到 未 来 3 个 月 中 的 某 天 。 与 列表 域 类 似 ， 范 围 域 
也 是 格式 域 的 精简 。 








基于 以 下 几 个 原因 ， 域 是 非常 有 用 的 。 








O 插入 数据 前 ， 通 过 域 的 检查 来 提高 数据 质量 。 这 是 域 存 在 的 主 
要 原因 ， 通 过 限定 属性 的 可 能 取 值 来 降低 脏 数据 进入 数据 库 的 可 能 性 。 
例如 ， 每 一 个 表示 金额 的 属性 被 设置 为 “数量 域 "， 该 域 要 求 数字 的 长 度 
上 限 为 15 且 包括 小 数 点 后 的 两 位 ， 显 然 这 是 表示 货币 数额 很 好 的 一 种 方 
法 , “销售 总 额 ” 知 被 设置 为 “数量 域 ”， 则 不 允许 如 R2D2 这 样 的 值 被 添 
加 。 











D 数据 模型 的 交流 性 更 强 。 当 我 们 在 数据 模型 上 设置 了 域 ， 就 意 
味 着 数据 模型 的 一 个 属性 必须 具备 一 个 特定 域 的 特征 ， 这 样 数 据 模型 就 
变 成 更 容易 被 理 解 的 交流 工具 。 例 如 ， 我 们 可 以 让 “销售 总 额 *“ 净 销售 
颌 “标价 销售 额 *3 个 属性 都 可 以 共享 一 个 “数量 域 "， 进 而 共 至 域 的 特 
征 ， 它 们 的 取 值 都 被 限定 为 “ 货 





O 使 得 新 建 模型 、 维 护 现 有 模型 变 得 更 有 效率 。 当 一 位 模型 构建 
师 开 始 一 项 新 工程 时 ， 可 以 使 用 一 组 标准 域 来 节省 时 间 ， 而 无 需 重新 创 
建 。 例 如 ， 所 有 与 数量 有 关 的 属性 ， 都 可 以 同时 与 数量 域 关联 ， 这 样 可 
以 极 大 节省 分 析 、 设 计时 间 。 





5.4 练习 5: 设置 域 


为 下 列 3 个 属性 设置 适当 的 域 ? 


。 电子 邮件 地 址 
。 销售 总 额 
。 国家 代码 














V 对 业务 而 言 ， 属 性 是 非常 重要 性 的 特征 ， 其 值 用 以 识别 、 描 述 、 评 估 
实体 实例 。 


V 域 中 往往 包含 一 组 验证 标准 ， 使 得 域 可 以 被 多 个 属性 应 用 。 














V 域 的 不 同类 型 包括 : 格式 域 、 列 表 域 、 范 围 域 。 





第 6 章 KAR 





规则 无 处 不 在 ， 
关系 讲述 着 故事 ， 
并 把 一 个 个 情节 联系 起 来 。 


本 章 介绍 了 规则 和 关系 的 定义 ， 以 及 关系 存在 的 3 个 层次 ， 概 念 、 
逻辑 、 物 理 。 数 据 规则 有 别 于 行为 规则 。 基 数 及 标签 也 将 在 本 章 曾 述 。 
学 习 完 本 章 你 可 以 像 读书 那样 读 懂 任何 数据 模型 。 递 归 关 系 (recursive 
relationships) 和 子 类 型 (subtyping) 等 关系 类 型 也 将 被 讨论 。 


6.1 关系 的 解释 


通常 我 们 对 规则 的 理解 是 在 特定 情形 下 如 何 行为 的 规定 和 指示 。 以 
下 列举 了 你 应 该 非常 熟悉 的 关于 规则 的 例子 。 


。 在 你 外 出 玩 页 之 前 ， 房 间 必 须 被 整理 干净 。 
。 如 果 击 球 手 3 次 挥 棒 不 中 ， 则 三 振 出 局 ， 轮 到 下 一 位 击 球 手 回合 。 
。 限 速 每 小 时 55 英 里 (1 英里 ws1.61 千 米 ) 。 


数据 模型 中 的 规则 即 为 和 关系， 关系 被 表示 成 一 条 连接 两 个 实体 的 线 
段 ， 用 来 说 明 实 体 间 的 规则 或 导航 路 径 。 如 采 两 个 实体 分 别 
为 “Employee”( 员 工 ) 和 “Department”( 部 门 )， 则 关系 可 以 描述 的 规 
则 有 “每 位 员工 必须 服务 于 一 个 部 门 关 一 个 部 门 可 以 拥有 一 位 或 多 位 员 
工 ”。 





6.2 关系 的 类 型 











规则 可 以 是 数据 规则， 也 可 以 是 行为 规则 。 数 据 规则 指示 数据 间 如 
何 关 联 ， 行 为 规则 指示 当 属 性 包含 有 茶 特 定 值 时 ， 需 要 采取 什么 操作 ， 
下 面 首 先 介绍 数据 规则 。 











存在 两 种 类 型 的 数据 规则 ， 结 构 完 整 型 (structural integrity, SI) 
和 参照 完整 型 (referential integrity, RI) 。 结 构 规则 〈 又 被 称 为 基数 规 
W) 定义 了 参与 某 个 关系 的 实体 实例 的 数量 ， 例 如 : 


每 种 产品 可 以 出 现在 一 个 或 多 个 订单 行 上 。 
每 个 订单 行 上 有 且 仅 有 一 则 产品 。 
每 位 学 生 必 须 有 唯一 的 学 号 。 








免费 样 章 到 此 结束 。 





